当前位置:首页 » 新媒体运营 » 正文

网络小说生成器,能写散文、编小说、还能作诗词,这么聪明的开源工具牛掰了

4807 人参与  2022年07月15日 10:36  分类 : 新媒体运营  评论


还记得前几天猿妹和大家分享的文章生成器么?《“狗屁不通文章生成器”火爆Github,一句话生成万字论文的神器了解一下?》,通过它,你只需要输入一句话,它就会生成一篇万字论文,当然这篇论文,你只要认真读一下,就知道它真的是在一本正经的胡说八道。

今天猿妹和大家分享一个更高级的文章生成器,它使用用BERT的 Tokenizer 或 Sentencepiece的BPE 机器学习模型,可以写诗,新闻,小说,或是训练的通用语言模型。支持字为单位或是分词模式或是 BPE 模式(需要略微修改项目中 train.py 的代码),支持大语料训练。

能写散文、编小说、还能作诗词,这么聪明的开源工具牛掰了


GPT-Chinese在Github上标星.K个Fork。(GitHub地址:
https://github.com/Morizeyao/GPT-Chinese

目前这个项目主要架构已经稳定,第一个预训练模型已公布,为散文生成模型。

使用方法:

  • 在项目根目录建立data文件夹。将训练语料以train.json为名放入data目录中。train.json里是一个json列表,列表的每个元素都分别是一篇要训练的文章的文本内容(而不是文件链接)。

  • 运行train.py文件,勾选 --raw ,会自动预处理数据。

  • 预处理完成之后,会自动执行训练。

生成文本

  • --fast_pattern (由LeeCP贡献):如果生成的length参数比较小,速度基本无差别,我个人测试length=时,快了秒,所以如果不添加--fast_pattern,那么默认不采用fast_pattern方式。

  • --save_samples:默认将输出样本直接打印到控制台,传递此参数,将保存在根目录下的samples.txt。

  • --save_samples_path:可自行指定保存的目录,默认可递归创建多级目录,不可以传递文件名称,文件名称默认为samples.txt。

以下为文学散文的生成样例,你体会一下:

能写散文、编小说、还能作诗词,这么聪明的开源工具牛掰了


能写散文、编小说、还能作诗词,这么聪明的开源工具牛掰了


还有更厉害的,还能生成古诗词,以下为古诗词的生成样例:

能写散文、编小说、还能作诗词,这么聪明的开源工具牛掰了


除了散文、古诗词,还有金庸小说的生成案例呢:

能写散文、编小说、还能作诗词,这么聪明的开源工具牛掰了


本文链接:https://www.woshiqian.com/post/124794.html

百度分享获取地址:https://share.baidu.com/code
网络小说生成器  

我是钱微信/QQ:5087088

广告位、广告合作QQ:5087088

<< 上一篇 下一篇 >>

  • 评论(0)
  • 赞助本站

       

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。