Skip to content

博主这个模型结构内,In18 里有一个定义全局网络层的操作,是为了保证每一次解码的时候Attention参数都是共享的吗,我自己照着写了一个,当时看这一步觉得有点多余就没做定义,最后发现每一个时序的Attention参数是不共享的了。。。求指点哦~ #38

@ArnoTeng

Description

@ArnoTeng
No description provided.

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions