我扒了扒最近爆红的写字机器人,发现背后的原理是台挖掘机
与此同时,网友对这个写字机器人背后的黑科技也感到无比的好奇,纷纷想探究一下这背后的秘密。
在好奇心的驱使下,写字机器人的销量一发不可收拾,淘宝上很多店铺都号称已经卖断货,排队已经排到了半个月以后。
要知道这一个写字机器人价格可不便宜,最低的也要好几百,大多都在千元以上,对于小学生来说那就是一年的压岁钱。
那么这个写字机器人背后的原理到底是什么呢?是不是真的有什么惊人的黑科技呢?
答案就是:有科技,但不够黑。
其实这个所谓的写字机器人,原理就是数字控制技术,常见的应用领域有工厂里面的数控机床和机械臂等。而写字机器人,其实就是把数控机械的刀头换成了笔头,除了写字之外,甚至还能用来画画。
说到机械臂,可能大家没什么印象,但其中这玩意儿在我们的生活中十分常见,比较小型的机械臂大概长这样:
而比较大型的机械臂大家就更熟悉了,它一般是长这样:
原理虽然简单粗暴,但是写字机器人的效果还是非常显著的,它不仅操作简单,而且功能强大,甚至可以模仿你的字迹。
首先,这个机器在用法上就非常的简便,到手之后无需组装,只需要用USB直接连接电脑(或手机),然后下载对应的软件(或APP),接着再导入文档,然后就可以自动抄写。
而且软件还支持表格excel导入,笔记和作文本功能支持word文档导入,并且可以自动分页自动排版,不需要频繁复制粘贴。
其次,更牛逼的点在于,这个机器人还能模仿你的字迹,完美克隆你的作业。这部分的原理大概就是先录入你个人的字体,做出字体库。
具体措施主要分为两种:
一是用电容笔+APP在手机上录入笔迹。
二是用电脑+手写板在电脑上录入笔迹。
通过这个原理,只需要录入大概3000个常用字之后,你就可以做出属于自己的字体。有特殊需求的用户甚至可以做出多套字体,随机使用,写字更加逼真!
最后还要提到的点是,这个机器的抄写速度非常快,传说有小学生两天抄完了所有寒假作业。
目前来看,淘宝上最初开卖写字机器人的那一批卖家基本都已经卖断下架了,他们的机器经过专门设计,写字速度大概能达到1分钟60-70个,比人为抄写要快不少,几乎能够赶上日常打字速度。
但是这个速度并不是所有产品都能达到的,后续跟风涌入的不少卖家产品写字速度大概只能达到1分钟20-50个左右。
我个人猜测,这部分卖家的产品很可能是看了新闻之后为了蹭热度,临时用数控机器改装的,产品优化得还不够……
你看看,商机总是在你意想不到的时候出现,工人伯伯们商业嗅觉可比咱们敏锐多了。
当然啦,这个机器人也没有想象中的那么神奇,使用条件其实还蛮苛刻的。
首先,所有的抄写任务必须要能提供可复制的电子文件,比如Word,Excel,txt文件,你要是纸质版的练习册那肯定是不行的。
其次,纸张必须要能压平,想办法压平才行,压不平纸张很可能就给你划破了。
第三,则是纸张限制,这些机器大部分的工作范围是A4,超出这个纸张大小就不在机器工作范围了。
最后还有一点就是排版分页问题,这个机器貌似还不够智能化,一次写完一页之后需要手动翻页,不是自动翻页的。
根据我用红包买来的卖家情报显示,笔记只需要一次性排版,自动分页,写完一页点下一页,继续发送写字,而表格表格则需要一页一页排版。
不过好在实际操作起来其实也不麻烦,做好模版之后只需要更新数据就可以。
最后的最后,重点PS:
粗暴的黑科技给大家介绍得差不多了,但是建议大家千万不要盲目购买!
因为在写字机器人火了之后,不少人涌入某宝购买写字机器人,其中不少消费者比商家还要精,选择了抄完直接退货。
所以这些写字机器人卖家都特别声明一点:检测书写字数,超过5000字概不退货,还有的店家直接表明不支持7天无理由退货。
不过我觉得,之所以不支持无理由退货,很有可能是因为这玩意儿并不实用,卖家怕消费者买了就后悔,所以只打算赚一笔是一笔。
总而言之,大家即使有需要也尽量谨慎购买,千万别被噱头忽悠了。返回搜狐,查看更多
机器人写稿的技术原理及实现方法
而从2008年至今这不到10年间,在图像识别和语音识别领域的成果激励下,学术界开始逐渐引入深度学习来做NLP研究,并在机器翻译、问答系统、阅读理解等领域取得一定成功。
随着NLP、深度学习以及大数据等技术的长足发展并开始在工业应用上大放异彩,处于快速转型期的新闻行业,也对这些技术在新闻生产领域的应用展开了积极的想象。写稿机器人,正是技术发展和行业变革催生的一股潮流。
机器人写稿的三种实现方法
NLP的机制涉及两个流程:自然语言理解(NaturalLanguageUnderstanding,简称NLU)和自然语言生成((NaturalLanguageGeneration,简称NLG)。
现有的写稿机器人,或者广义来说,就是一个自然语言生成系统,主要有模板式、抽取式和生成式这三种技术方向。
1.模板式
模板式是目前应用最成熟、也是最容易理解的一种实现方法。
当前模板式的机器人写稿方法,主要是通过利用优化算法,智能选择不同的模板组合进行新闻生成。具体的实现过程包括:基于输入的知识点与模板库进行候选模板检索;利用优化算法进行智能模板筛选,确定最终真正使用的模板;基于筛选得到的模板进行新闻文本生成。地震写稿机器人、腾讯的DreamWriter等,都是这一类典型产品。
以DreamWriter为例,这是腾讯技术团队开发的自动化新闻写稿机器人,它能根据算法在第一时间内自动生成新闻稿件,对新闻事件主题进行实时分析和研判,结合一系列的数据库和机器学习算法等技术,在较短时间内为用户传送重要的新闻资讯,帮助用户快速解读内容。
DreamWriter生产一篇完整的新闻,主要由五个步骤组成:建设内容数据库,基于数据库的机器学习,基于具体主题进行写作,以及最后的内容审核和渠道分发。
首先,研发人员需要为DreamWriter构建一个内容丰富、具有海量新闻数据的数据库,比如每个赛季完整的欧洲主流足球联赛的全套数据,从球员、球队、赛事安排、比赛进程、环境因素、球员之间的对抗数据等等各个细分维度,对数据进行归类、整理,形成一个庞大而又精准的数据仓库,这个庞大的内容数据仓库就成为了机器人自动生成足球新闻报道的原料仓库。
在完成数据库建设的基础上,相关的大数据技术团队就会基于数据分析和算法设计,对于数据仓库中每一项数据所对应的写作模板进行学习和理解。基于模板的机器人写稿学习过程如下图所示:
比如报道一个足球赛事,DreamWriter这类机器人就会在前期的学习过程中,去理解球员比赛过程中的具体动作,包含了射门、扑救、铲球、传球以及犯规等动作,DreamWriter会将这些动作名词进行随意组合,同时结合足球比赛的规则特点,变成一整套足球赛事内容表述。
由于随意的组合,内容会出现严重的差错,因此DreamWriter会基于数据仓库中的文本内容进行大量的训练学习,最终使得DreamWriter的写作水平能够接近甚至达到标准新闻写作的水平。
在实现短文本的内容生成后,DreamWriter会基于新闻的整体报道主题,比如体育或者财经,来生成一个特定的新闻内容框架,在内容框架下,DreamWriter会生成相应的文本内容,形成一篇报道。
DreamWriter目前的主要功能仍局限于体育财经类的资讯,由于这类内容报道结构相对固定,对DreamWriter来说,写作难度并不大,但面对类似突发性新闻等比较难以预期的新闻,DreamWriter的表现水平就有待提升了。
2.抽取式
在新闻信息领域,利用机器人从海量的已有文本素材中抽取重要信息,进行“二次创作”,也是一种较为常见的自动写稿方法。
当前,一个典型的抽取式自然语言生成场景是,基于抽取式的文本自动摘要生成。它是能够帮助用户短时间内从海量数据当中抽取重要信息内容的有效途径,也是在新闻搜索、个性化推荐等场景下,从原始文本内容中快速抽取重要信息,生成核心摘要内容的重要方法。
自动文摘生成主要由三个步骤构成,如下图所示:
图中的文本分析过程是对原文本进行分析处理,识别冗余信息;文本内容的选取和泛化过程是从文档中辨认出重要信息,通过摘录或概括的方法压缩文本,或者通过计算分析的方法形成文摘表示;文摘的转换和生成过程实现对原文内容的重组或者根据文本内部位置表示信息来生成文摘,确保文摘的连贯性。
基于抽取式的自动文本摘要技术应用最广的领域在于新闻。
新闻信息的过载,让人们迫切希望有这么一个工具可以帮助自己用最短的时间了解最多的最有用的新闻,而很多新闻为了哗众取宠,故意将标题起得特别吸引眼球,但却名不副实,因此就有了Yahoo公司的Summly产品(一款新闻摘要App)。另外,新闻搜索引擎也是应用之一。
以百度搜索页中关于中国队对阵卡塔尔的世界杯预选赛新闻报道为例,可以简单说明基于抽取式的自动文本摘要技术如何帮助用户节省浏览新闻耗费的时间。
中卡预选赛之前百度搜索页中的报道情况。
当用户通过关键词搜索“中国对战卡塔尔世界杯”相关内容时,在页面的新闻推荐列表中,每条新闻的标题下会有一个对应的简短内容摘要呈现给用户。此时用户通过浏览摘要的内容,就能大致了解整篇新闻的主要内容,并且帮助用户能在第一时间对多篇新闻内容进行筛选。其中摘要的内容必须保证和全文的相关性,同时也要保证新颖性,尽可能减少冗余信息。在生成这些摘要文本的背后,是有一整套机器学习算法和深度学习技术在支撑。
首先,搜索系统根据用户意图从新闻库中搜索出所有有关中国与卡塔尔世界杯预选赛的新闻,并且进行预处理,包括分词和分句的处理,即将文本分成一个词的集合以及句子的集合。
接下来基于一系列算法实现对于句子的重要性排序,其中典型的有基于图排序和基于特征的排序算法。图排序算法会构建一个图网络模型,文档的每句话都看作是图网络中的一个节点,句子之间的相似度作为节点之间的边权值,句子之间的相似度计算公式如下:
利用PageRank原理来迭代传播权重计算各句子的得分,作为生成短摘要的重要参数,图模型公式如下所示:
基于特征的算法主要是会考虑到句子的相关特征,例如句子长度、句子位置、关键词得分、是否包含标题词等等,通过TextTeaser算法得出句子的重要性得分。比如中卡之战新闻的短摘要中,可以看到摘要里面的内容都是跟新闻主题保持紧密相关性,没有其他冗余信息掺杂。
在求得句子的相关性基础上,通过引入一个惩罚因子,将句子的新颖性作为参考因素加入到最终的排序当中。最终得到的结果一般是相关性排序后的前N句话,为了保证可读性,需要按照原文中的顺序,将排序之后的句子按原文顺序输出,在一定程度上保证语义上的连贯性。
目前,这一模式在一些新闻编辑室中也已有所应用。比如微软(亚洲)互联网工程院的人工智能产品小冰入驻钱江晚报“浙江24小时”客户端,变身机器人记者,其中一项职能就是基于微软必应搜索引擎,利用全网大数据和公开的社交平台数据,生产包含一张图片、一个标题、一段梗概、两个观点的“新闻卡片”。
3.生成式
以上两种技术在新闻资讯领域的应用,已相对常见。而生成式,在现阶段尚无典型的产品。
生成式自然语言生成,主要指通过序列的深度学习和增强学习技术,机器可以根据现有文本生成模型,比如说机器人会把数据库里某些更新的信息用自然语言的形式写成报道。当然,这种报道不需要特别深入的调查,也不需要去了解各个事件背后的关系,理论上这是可以由机器来做的。
当前比较热门的AI生成文本的场景有:例如,用莎士比亚的作品来做训练,模型就能生成类似莎士比亚的句子;利用汪峰的歌词做训练,模型也能生成类似歌词的句子来;或者是自动生成新闻标题等等。这类产品很多都是引入了一些深度学习模型,像Seq2Seq+Attention模型等,基于大量文本集进行学习,然后自动生成一些比较接近于人类日常表达方式的文本。
Seq2Seq模型基于输入序列,预测未知输出序列。模型由两部分构成,一个编码阶段的”Encoder”和一个解码阶段的”Decoder”。如下图的简单结构所示,Encoder的RNN每次输入一个字符代表的embedding向量,如依次输入A、B、C及终止标志,将输入序列编码成一个固定长度的向量;之后解码阶段的RNN神经网络会一个一个字符地解码,如预测为X,之后在训练阶段会强制将前一步解码的输出作为下一步解码的输入,如X会作为下一步预测Y时的输入。Seq2Seq模型如下所示:
以下,我们选择中卡世界杯预选赛的相关新闻集合为语料,包含新闻的标题和正文的信息,基于Seq2Seq模型来尝试用机器自动生成新的标题内容。
首先对收集的新闻集合需要进行预处理,包含去除一些特殊字字符、表情符以及全角英文等等,同时对日期、数字等进行替换。在完成预处理后,准备进行训练的语料:source输入序列定义为新闻的正文内容,带预测的目标序列为该新闻内容的标题。为了保证训练的正文不宜过长,source序列的分词个数要限制在一定的数量,比如100个词左右,同时目标序列的长度也有要求,保证在30个词以内。接下来基于Seq2Seq+Attention训练生成模型。模型训练完成之后,可以输入一些分好词的新闻正文,来自动生成标题,与人工编辑的新闻标题进行对比。
新闻部分核心关键词新闻标题机器生成标题国足,客场,卡塔尔,强赛,主场,资格,小组,积分,乌兹别克,排名,男足,输给,拿到,比赛,形势,第三,对手,获得,参加,要素,附加赛中国VS卡塔尔国足想拿小组第三需满足四大要素中国对手卡塔尔出线形势中国队,卡塔尔队,世界杯,客场,预赛,比赛,强赛,击败,苦主,晋级,刷卡,主场,战胜,亚洲,无缘,提前,最后,预选赛,俄罗斯国足vs卡塔尔前瞻:出局对手多次击碎国足出线梦卡塔尔击败中国多次不胜上面的表格将编辑人工生成的新闻标题与机器生成的标题进行对比,可以看到基于Seq2Seq生成方式得到的标题一定程度上能够反映内容主题,但从标题语句连贯性以及和主题相关性角度来看,还无法达到人工编辑的水平。
结语
通过上述分析,我们简单描述了目前机器人写稿的工作机制。尽管生成式,在理论上最智能,或许也可视为自然语言生成技术更高级的目标。但从现阶段的应用来看,显然模板式和抽取式,在使用效率和可靠性上更优。自然语言生成,从学术领域的研究,到陆续有一些创新产品和项目应用于工业界,是一种巨大的进步,但仍有很长的路要走。
对于新闻行业来说,人工智能技术的应用,可以极大提高出稿效率,对突发事件实现快速反应;媒体从业者也可以借助人工智能技术把内容输送到算法推荐平台,实现精准传播;记者又可以依托于人工智能技术获取不容易得到的数据。这一切都能极大地推动新闻创作乃至媒体传播领域发生突破性变化。
但同时,人工智能也可能会给新闻编辑室带来一系列新的问题。比如,机器人可能无法感知兴趣之外的新事物和新议题,陷入主题狭隘的境地,或者机器人只关心自己关心的事,无法培养新的兴趣,很难像专业编辑人员一样来平衡传统媒体信息筛选、议程设置和普通受众的个人喜恶之间的关系;同时,一些人会利用人工智能技术来伪装人类生成一些虚假的内容,误导用户。用户的阅读面与视野很有可能会被人工智能算法主导,变成井底之蛙。(申屠晓明:浙江大数据交易中心甘恬:浙江传媒研究院)返回搜狐,查看更多