输出-带有 keras 的 Transformer Network - 验证是否需要解码器输入?
发布时间:2022-08-05 15:57:58 414
相关标签: # 研究# 数据
我已经研究了 Transformer 网络以应用于我的数据集。我从开源学习如下;
https://colab.research.google.com/drive/1CBe2VlogbyXzmIyRQGH5xzuvLwGrvjcf?usp=sharing#scrollTo=pjhneKhvtIi-
根据他们的代码,他们使用 keras 库中的“模型”,输入形状为 [input,target],输出形状为 [target]。输入是编码器的输入,目标是解码器的输入,也是解码器的输出。
这是他们提供的代码。
input_vocab_size = tokenizer_pt.vocab_size + 2
target_vocab_size = tokenizer_en.vocab_size + 2
x = encoder(input)
x = decoder([target, x] , mask = encoder.compute_mask(input))
x = tf.keras.layers.Dense(target_vocab_size)(x)
model = tf.keras.models.Model(inputs=[input, target], outputs=x)
当他们训练这个时,这个 ML 模型还需要像 [input,target] 这样的相同输入形状来测试代码。这意味着我们需要“X”和“y”来预测“y”来验证这个模型,这是没有意义的。
似乎我需要将训练和测试过程分开,以便我们使用 [input, target],[target] 训练模型,然后使用 [input],[target] 进行验证。如果我想这样进行验证该怎么办?
特别声明:以上内容(图片及文字)均为互联网收集或者用户上传发布,本站仅提供信息存储服务!如有侵权或有涉及法律问题请联系我们。
举报