“AI诗人的十四行诗能赛过莎翁的吗？”-欧洲时刊

本篇文章7219字，读完约18分钟

原始的j.l t.c t.b a.h神经现实来自专辑的深度

人工智能创作的简史

这是莎士比亚第18行第14行诗的一段

shallicomparetheetoasummer ' sday？

thouartmorelovelyandmoretemperate :

roughwindsdoshakethedarlingbudsofmay、

and summer ' sleasehathalltooshortadate

我可能会把你和夏天比吗？

你比夏天更可爱。

狂风吹走了五月的花蕾

夏天也匆匆而过*

* *译者注

本文中出现的莎士比亚十四行诗的中文译本，除非另有证明，均为梁实秋译本。

- john burningham -

这是人工智能程序deep-speare写的14行诗

在陶瓷板上放置it流、

按此顺序显示、按此顺序显示、

从三角形、从三角形到半角形、

“和科学之城”

它流淌着，在苍白的漩涡里

穿过明亮的阳光，他的光辉闪耀着

终于滚落在细沙子上，像雪一样的花蕾含苞待放

轻瞄着身体悄然逝世

如果仔细阅读deep-speare写的诗，你可能会发现这很荒谬，但它确实符合章法。据英语老师说，乍一看，这首诗每一行的节奏、节奏、基本语法都是一样的。正如我们的研究小组发现的那样，如果向全世界展示ai创作的诗，很多人会被骗。大多数网民分不清ai创作的诗和人类作者创作的作品。

我们的团队由三名机器学习研究者和一名文学家组成，我们用古腾堡工程在线图书馆( project gutenberg )收录的2700首14行诗训练ai诗人。我们的ai诗人利用叫做深度学习的ai方法，发掘训练数据库中的诗，不断“冥思苦想”符合样本的诗句，学会了自己创作诗。我们没有像以往的项目那样，向ai诗人输入节奏、发音方面的词典等资源，但是deep-speare通过摸索，找到了自己写14行诗的三个要素，即节奏、节奏、自然语言的基本原理(也就是说，

* *译者注

古腾堡工程( project gutenberg )致力于文化作品的数字化和归档，是以“鼓励电子书创作和发行”为宗旨的志愿服务事业。这项工程始于1971年，是最早的数字图书馆。截至年7月，古腾堡工程主张藏书40，000多件。

我们的目标是深入学习在生成自然语言方面能做到什么程度，以及如何充分利用诗的兴趣特质。特别是十四行诗这样的诗，节奏和节奏都是刻板的，有规律的模式，所以我想知道能否使用设计系统让deep-speare自主学习。

我们的努力与计算创意行业的繁荣分不开。 ai创作的肖像画在纽约佳士得( christie”s )拍卖会上以43.2万美元的价格成交的ai作曲项目deepbach创作的巴赫风格的音乐作品真的在令人难以置信的雕刻和舞蹈世界中，也可以看到ai的身影。除此之外，在语言和文学方面，来自openai实验室的gpt-2文案生成系统在实力上表明，人工智能只需要开头句就能生产出相当流畅的文案段落。

* *译者注

计算创造力(也称为computatinal creativity、人工智能创造力、机械创造力或创造力计算学)是一个跨学科的研究行业，位于人工智能、认识心理学、哲学和艺术行业的交叉点。

- -弗兰克·霍纳-

在过去的十年中，深度学习的繁荣使关于这些计算创造性的实验成为可能。深度学习具有创作追求的几个重要特征:对初学者来说非常灵活，而且可以比较容易地训练出能够执行各种任务的深度学习系统(我们称为模型)。这些模型善于发现模式并从中总结，有时也会产生惊人的结果。这个特征也被称为“偶发创造性”。另外，深度学习算法内在要素的随机性会导致输出结果的千变万化。这种结果的千变万化，如果人类合作者能够耐心筛选，这种偏差就非常适合创造性应用。除此之外，深度算法还可以比较容易地创建解决各种类型的数据(如复制、语音、复制、视频等)的模型。

诗是怎么写的？

关于自然语言解决模式

十四行诗最重要的优点是十四行长和两部分组成的“论证”结构。后者的意思是诗人通常在诗的前半部分提问，最后一部分解答这个疑问。在16世纪，英国诗人用“五步抑扬顿挫”( iambia pentameter )的节奏方法创作了一首诗。也就是说，一行诗有十个音节(五音步)的重要音的节奏。一般来说，14行诗由用来提出“问题”的4行诗( quatrain )和末尾的对句( couplet )组成，诗的节奏常常是“abab cdcd efef gg”。在莎士比亚手中，这种韵律形式被采用为最纯粹的形式，今天被称为“莎士比亚体的十四行诗”。

deep-speare项目组试图生成莎士比亚十四行诗前半部分的“问题”部分的四行诗。因此，比起单纯复制诗的14行形式和结尾两行的“论证”诗句，更注重生成“五步抑扬格”和符合韵律的文案。也许将来的某一天我们会继续克服这个更难的挑战，但现在我们必须说明ai诗人有能力创作单独的四行诗。

deep-speare使用三种自然语言解析模型制作，即判断候选单词的概率并选择合适的单词的语言模型、判断每行诗的节奏的节奏模型、保证每行诗遵循节奏的节奏模型。

I诗人随机选择经典节奏创作诗祭。例如，下图中的示例使用“abba”押韵方法。也就是说，4行诗节中，最初和最后两行押韵，中间两行押韵。掌握了这个模板之后，它开始以惊人的方式生成这首诗。从最后一行的最后一个词开始，从右向左生成符合规则的副本。

1 .在上图的例子“from pardon to him，WHO will stand wait”中，deep-speare首先从句末的“wait”这个单词制作副本，利用上述的概率解决模型，关于单词的选择。虽然从中进行了排名，但是模型并不直接采用概率最大的单词，而是从5个单词中随机选择一个。

2 .以简化为前进方向，ai诗人通过逆算各词进行文案生成，各候选单词的概率得分表示单词间的邻接关系和在同一句中出现的概率(参照下图)。。

3 .利用这样的做法，ai诗人产生多首候选诗句，接着节奏模型对它们评分，找出符合“五步抑扬格”节奏规律的诗句。

shallibeholdhiminhiscloudystate

forjustbuttemptethmetostayandpray

克里: if it威尔德曳me，无法寻找

怎么看他忧郁的雾呢

在意的我停下来祈求安慰

只是害怕泪水袭来，无法应对

4 .将后退作为前进、后退，ai诗人重复这样的步骤，用从最后一句到第一句的方法，持续制作副本。

5 .在第2首和第1首诗结束时寻找合适的单词(“pray”和“state”)，ai诗人就会对候选单词的“韵度”进行评分，找到与“way”和“wait”押韵的辞藻。

总结一下，我们的系统由三部分组成。一个是学过“五步抑扬顿挫”的节奏模型，一个是学过词汇押韵的模型，另一个是学过单词之间经典搭配的语言模型，语言模型是能逐字生成十四行诗的最主要部分。

- Vera摩尔Nar -

语言模型按照概率得分的方式对任意句子进行排名，评价这些句子用某种语言是正确的(在我们的例子中是英语)。训练良好的语言模型会给流利的句子带来高概率点，给无意义的句子带来低概率点。考虑到语言的生产和理解方法通常是逐个单词进行的，这个原理实际上可以将更多复杂和句子层面的问题分解为单词层面的简单问题。因此，语言模型的工作是从部分句子中预测下一个单词是什么。为了进行这种预测，模型将搜索所有可能的单词，并给出依赖于当前句子中现有词汇的概率分数。

语料库

一般来说，自然语言模型根据语料库中的单词和句子来评估拷贝的出现概率。语料库的副本可以来自维基百科词条、reddit讨论或用于训练语言解析的语料库。从文案库中，人工智能可以学到那些单词最频繁出现。在我们的deep-speare项目中，ai诗人从在线图书馆project gutenberg收录的所有诗中学习语言运用的基本课程，用包括36.7万词在内的2700首莎士比亚十四行诗进一步磨练了14行诗的创作能力。

人们对以下单词的“惊讶”程度可以用来衡量语言模型的质量。如果对下一个单词给出了高概率分数，就证明这个单词的出现符合规则，所以不惊讶。但是，如果被给予低概率分数，人们读这个单词时会很尴尬。这种惊讶程度在训练模型的过程中被认为是重要的信号。因此，如果我们每次都用大量的副本来解决所有的词汇，而且不惊讶于模型连成一体的词汇，我们就认为这个模型已经在很大程度上掌握了语言的多样性和复杂性。这包括不分解“san -francisco”这样的多个单词组成的短语而正确利用，遵循句法和语法结构，评价更多复杂的意义和逻辑新闻(例如，咖啡“强”和“淡”

语言模型一旦训练，就不难凭空生成单句或多句诗句。

--Tom飞利浦-

接着，让节奏模型遵守10个在各行诗歌中以轻音重音模式结合音节的规则，然后检查各单词的字母和句子的标点符号，根据字母决定应该如何分配音节，将哪个音节分类为重音例如“summer”一词有两个音节，“sum”是重音，“mer”是轻音乐，当deep-speare写四行诗时，语言模型生成候选诗，节奏模型从中“五步抑扬”

韵律模型也从过去14行的诗集中包括英ju华学会，但只看到了各行最后一个单词的文字。在训练过程中，我们告诉模特，四行诗每首诗的最后一句话都需要押韵。然后，找出哪个词中最相似的词，越相似的词越有可能押韵。以莎士比亚的诗为例，《每一天》和《每一天》的韵得分都很高，《模板》和《每一天》也是如此。

当deep-speare经过训练并准备创作时，它将提供莎士比亚十四行诗中三个最经典的韵律模板。是abb、abba和abab 在写作过程中，语言模型首先随机选择其中一个模板，然后逐词生成诗句，在写出需要押韵的单词时，为韵模型提供多个候选单词。

有两个很好地说明deep-speare制作拷贝的过程的例子。第一份拷贝是由稍微训练过的模型制作的，我初步掌握了韵律，但找不到节奏。另外，诗读不好。

bycomplexgrief“spettynurse.hadwiseupon

亚伦

电子邮件健康，出类拔萃

在体验上，我在I join

andlonginthehearsandmustcangodtorun

来自许多悲伤美丽的护士

来吧我所有的美，除了歌

在光明的未来里，我参加的形式

要听很久，就必须走神

可以看到，第二篇文案是从训练完成的模型中产生的，比第一篇取得了更大的进步。 abba节奏准确，遵循“五步抑扬格”，语言不仅流畅而且富有诗意！

shallibeholdhiminhiscloudystate

forjustbuttemptethmetostopandpray

克里: if it威尔德曳me，无法寻找

从天堂到海姆，世卫组织。

怎么看他忧郁的雾呢

在意的我停下来祈求安慰

害怕眼泪，袭击过来我应付不了

原谅某人，某人停下来等待

I诗人写的诗到底好不好？

在验证deep-speare的输出结果时，首先要确认语料库中的原文没有被复制。我们发现那部作品的诗句和训练数据没有很大的重叠。因此，我相信ai诗人并不是光靠复制粘贴来创作作品的，其诗可以说都是原创的。

但是，原创不是质量好的代名词。为了检验作品的质量，我们请了人类评委进行分解。他们来自两个不同的背景。第一批评委是亚马逊mechanical turk平台雇佣的众包工人，他们只有基础英语，没有诗歌方面的专业信息。我们向他们展示了ai诗人和人类诗人写的14行诗，让他们指出哪一首是人类写的。

- camilo huinca -

但是，最初的检查结果让我们很失望。因为工人们几乎可以完美地指出哪首歌是人类的诗。机器学习的结果看起来明显不符合人们的鉴赏标准。那么，我们ai诗人的研究道路到此为止了吗？

然后，我们思考了这几乎100%识别率背后的理由。也许是因为第一批评委作弊了。因为我们的语料库来自古腾堡工程的在线图书馆，所以复印件都可以检索，所以我们在想，我们是不是复制他们应该评价的诗，在网上寻找是谁写的。抱着这个推测，我们的研究者也根据葫芦画瓢，进行了测试，但事实表明我们是正确的——人类诗歌作品总是能找到一点点的结果，达到100%的鉴别率是一个拿到手的事件。

为了防止评委们作弊，我们把所有被鉴别的诗都转换成了图像，请他们指出哪一首是人类的诗作品。看！这次他们的正确率几乎从100%下降到了50%。这说明他们无法准确区分人类和机器人的诗歌作品。我们还不能阻止所有人手动输入诗在谷歌上出结果，但是手动搜索确实需要很多时间。总结一下，这次正确率的下降在某种程度上证明了ai诗人的作品确实是假的，是真的。

我们的第二位评委是多伦多大学文学助理教授亚当·哈蒙德( adam hammond )。与第一组评委的测试过程不同，第二次质检不再是推测游戏。相反，哈蒙德接受人工和机械混合的诗，从节奏、节奏、可读性、情感影响较大的4个维度进行评分。

他给deep-speare的14行诗赋予了很高的韵律分和节奏分，但实际上韵律和节奏的评分比人类写的14行诗要高。结果，哈蒙德也没有感到惊讶。他认为人类诗人定期打破规则，取得诗歌的效果。反而在可读性和情感影响较大这一点上，ai诗人明显较差，文学专家可以在这两方面简要指出哪一个是机器创作。

ai写诗的能力是幻想吗？

deep-speare项目最感兴趣的地方之一就是它引起的关注。我们在年度计算语言学学术会议上结束报告后，世界各地的信息媒体报道了这一成果。许多复制品引用了下面的诗节来表明ai诗人deep-speare可以创作出像人类一样创造的诗。

withjoyousgambolsgayandstillarray、

“no longer when he ”twas，while in his day

atfirsttopassinalldelightfulways

“天”、“成”、“天”和“天”。

哈蒙德在BC广播电台接受采访时，主持人宣读了这一段并听取了他的意见，哈蒙德问主持人诗中明显的语法错误“he”twas”是否被观察为“he it was”(不成立的表达)的缩写

社会科学家Sherry Turk le ( Sherry Turk LE )把无视人工智能明显错误，却依然为其成果而叹息的现象称为“伊丽莎白效应”( the eliza effect )。换言之，人类可以过度解读机器产生的结果，也可以读取本来不存在的意义。这种现象可以追溯到19世纪60年代，在麻省理工学院，计算机科学家约瑟夫·威森鲍姆( joseph weizenbaum )开发了第一个聊天机器人伊丽莎白( eliza )，模仿了心理治疗师的说话方式。尽管这个程序相当粗糙，有很大的限制，但威森鲍姆惊讶地发现顾客很容易就被机器人“欺骗”了。 20世纪70年代，维森鲍姆的同事特克尔，甚至连知道伊丽莎白计划有缺陷的研究生也向机器提问，期待以接近正常人的方式回答。

“AI诗人的十四行诗能赛过莎翁的吗？”

特克尔将伊丽莎白效应称为“数字幻想中的人类共谋”，这看起来可以解释人们对deep-speare诗歌作品的赞赏反应。公众希望用这十四行诗来解释人工智能的力量，无视与之相反的证据。

这种故意的误解可能会阻碍ai诗人真正能力的迅速发展。我们还在继续着ai诗人的项目，目标之一是提高ai诗人作品的可读性和感情的影响。为了提高整体的流畅度，其策略之一是利用整个维基百科等大范围的语料库建立“预训练”语言模型，以便在较长时间的叙述中更好地掌握词汇的出现规律。在此基础上，我们进一步对其进行了14行诗文案生成的训练。

- tomasz wo？耐克公司-

我们也一样在思考人类诗人是如何创作诗歌的。他们总是坐在桌子旁，思考着“我的第一个单词应该是什么”，思考着下一个单词应该继续什么。相反，他们在心里构思主题和故事，然后用单词和句子表达想法。实际上，在deep-speare项目中，ai诗人可以根据所给的主题制作相关的副本。例如，允许主题为“爱”或“丧失”的诗句。让机器遵循一定的主题，可能会提高诗歌的流畅度，但除此之外，其词汇的选择并不丰富。那是因为我们必须经常学习那些词汇适合特定的主题。之后，我们用越来越多的分层语言模型进行实验，为诗歌生成高级叙事诗，然后像人类思考的路径一样，在这个框架下生成所有的词汇。

诚然，这是一个宏伟的目标，但我希望deep-speare项目将来能达到这样的标准。即使不能成为真正的ai莎士比亚，也要尽最大努力成为莎士比亚在《情女怨》中叙述的样子。

hehadthedialectanddifferentskill、

catchingallpassionsinhiscraftofwill。

“他有丰富的词汇和无数的妙招。

随心所欲全部折服人。 ”

作者: jey han lau、trevor cohn、Timothy Baldwin和Adam Hammond |封面: karolis strautniekas

译者: yingying |评审学校:里昂

排版:济一

原文:

spectrum.IEEE /建筑-智能/机械-学习/ this-ai -端口-主体-建筑-建筑-自然-阵列

原标题:“ai诗人的十四行诗，胜过莎翁吗？ ’

浏览原文信息进行推荐

英国开封重启服务业首相:我也爱酒吧，但请自重

23日，英国首相约翰逊发表《解封计划》，英国《解封》将进入新阶段。从7月4日开始，英国将更广泛、全面地解除封锁，酒吧、餐厅…。

标题：“AI诗人的十四行诗能赛过莎翁的吗？”

地址：http://www.ok-sl.com/ozdt/8844.html

欧洲动态

“AI诗人的十四行诗能赛过莎翁的吗？”

网友看了又看的文章

“马克龙鼓足勇气想给普京“上课” 结果被一串数据“打脸””

“放下，是治愈一切的良药”

“英国首相约翰逊宣布关闭全国酒吧餐馆剧院等公共场所”

“马克龙：解除隔离”

“艺术多兴趣”

“变了！英死亡病例数超意居欧洲第一”

“想赴英读研做好这些准备”

“最新研究：一心二用多媒体或导致记忆力不佳”

“曝光时间最长的照片”

“真厉害！跑步机上挑战百公里跑最快速度”

热门排行

“肠子的世界博大精深”

“Taycan 连续成功完成0”

“德国能源公司最新研究报告称： 4G通信网络废热可作市政供暖”

“接班未成身先退”

““工会大讲堂”今年首期报告会举行雷天太为工会系统党员干部讲党课”

“德国官方称“群体免疫”不适用于抗击新冠疫情”

“德劳工部建议：球员戴口罩比赛，15分钟更换一次 “口罩版”德甲复赛方案

“德国新冠疫情快速发展 “令人担忧””

“关于特朗普的健康状况，白宫给出了矛盾的新闻”

“动物的两个身体”

最新发布