返回

输出-带有 keras 的 Transformer Network - 验证是否需要解码器输入?

发布时间:2022-08-05 15:57:58 414
# 研究# 数据

我已经研究了 Transformer 网络以应用于我的数据集。我从开源学习如下;

https://colab.research.google.com/drive/1CBe2VlogbyXzmIyRQGH5xzuvLwGrvjcf?usp=sharing#scrollTo=pjhneKhvtIi-

根据他们的代码,他们使用 keras 库中的“模型”,输入形状为 [input,target],输出形状为 [target]。输入是编码器的输入,目标是解码器的输入,也是解码器的输出。

这是他们提供的代码。

input_vocab_size = tokenizer_pt.vocab_size + 2

target_vocab_size = tokenizer_en.vocab_size + 2

x = encoder(input)

x = decoder([target, x] , mask = encoder.compute_mask(input))

x = tf.keras.layers.Dense(target_vocab_size)(x)

model = tf.keras.models.Model(inputs=[input, target], outputs=x)

当他们训练这个时,这个 ML 模型还需要像 [input,target] 这样的相同输入形状来测试代码。这意味着我们需要“X”和“y”来预测“y”来验证这个模型,这是没有意义的。

似乎我需要将训练和测试过程分开,以便我们使用 [input, target],[target] 训练模型,然后使用 [input],[target] 进行验证。如果我想这样进行验证该怎么办?

特别声明:以上内容(图片及文字)均为互联网收集或者用户上传发布,本站仅提供信息存储服务!如有侵权或有涉及法律问题请联系我们。
举报
评论区(0)
按点赞数排序
用户头像
下一篇
删除 R 中某些行的额外数据 2022-08-05 13:32:34