1956 年,「人工智能」这一崭新学科在达特茅斯学院诞生。70 年沉浮,随着深度学习技术带来的一系列突破,人工智能在近几年又抵达新的高度。而作为人工智能的分支,自然语言处理也以前所未有的姿态出现在人们视野中,越来越多地为人所津津乐道。
语言是人类区别于其他动物的本质特性,在所有生物中,只有人类才具有语言能力,自然语言处理想做的事情,则是让计算机来处理、理解以及运用人类语言。自然语言处理的发展,将会带动一系列核心技术的发展,成为企业核心竞争力。
自然语言处理最早可以回溯到上世纪中期。
1949 年,美国人威弗首先提出了机器翻译设计方案。
20 世纪 60 年代,国外对机器翻译曾有大规模的研究,但由于低估了自然语言的复杂性,所以进展缓慢。
90 年代开始,自然语言处理领域发生巨大变化,人们希望系统能处理大规模真实文本,并能从语言中抽取有用的信息。
迈进 21 世纪,互联网的出现让信息量呈现爆炸式增长,得益于大数据、云计算、深度学习、知识图谱等各种技术,自然语言处理的发展迎来加速,在日常生活中扮演着越来越重要的角色,走上更加丰富的应用舞台。
如今,搜索引擎逐渐成为人们获取信息的重要工具,机器翻译越来越普及,聊天机器人层出不穷,智能客服开始服务于人类,写稿机器人涌现。
近两年,热度渐升的亚马逊 Alexa,既会作诗又能唱歌的微软小冰,又将自然语言处理推向另一个全新高度,让其被越来越多的大众熟知。
与之相对应,不管学界还是业界,对自然语言处理的谈论越来越多,更有甚者,自然语言处理被上升到战略层面。
比尔盖茨的一句话广为流传,语言理解是人工智能皇冠上的明珠。
微软全球资深副总裁沈向洋曾说过,在下一个十年里,人工智能的突破在自然语言的理解,懂语言者懂天下。
搜索 CEO 王小川也表示,搜狗从做输入法到做搜索,都是围绕语言展开。搜狗人工智能的战略的核心正是对语言的理解。
清华大学刘知远曾表示,自然语言处理体现了人工智能的最高任务与境界。只有当计算机具备了处理自然语言的能力时,机器才算实现了真正的智能。
当然,自然语言处理的发展并非一帆风顺,目前计算机还缺乏深层次的自然语言处理和理解能力,机器翻译、智能客服等也只能达到非常基础的水平,将深度学习应用于自然语言处理的局限也开始浮现。
自然语言处理的下一个十年将在哪里?
我们希望未来将会这样:搜索引擎更加精准,机器翻译更为实用,聊天机器人更能懂你,机器客服更加高效,自然语言处理在金融、法律、教育、医疗等行业,将迎来更加广泛的应用。
路漫漫其修远兮。
在自然语言处理领域顶会 ACL2017 上,我们看到会议规模创下历史高峰,不管论文投递数还是现场赞助商,都让人眼前一亮。
在与 ACL 占据同等地位的 EMNLP2017 上,神经网络、深度学习、信息提取、语义学、文本挖掘、机器翻译、表示学习、语义相似、文本分类这 9 个关键词成为重心,尤以前两者为甚。
今日头条人工智能实验室主任李航曾表示,神经符号处理的新范式被越来越多的人所接受,未来,神经系统与符号系统相结合将成为自然语言处理的重要发展方向。
在雷锋网看来,自然语言处理注定是一个需要学界、业界携手参与,共同推动的交叉性学科。接下来,这一学科将会朝向何方发展,我们拭目以待。
当下,自然语言处理研究到底到了哪一阶段?还有哪些亟待突破的技术难点?接下来又将产生哪些服务于大众的应用?来 CCF-GAIR 2018 大会,你将找到答案。
由中国计算机学会(CCF)主办,雷锋网与香港中文大学(深圳)承办的第三届 CCF-GAIR 全球人工智能与机器人峰会将于 2018 年 6 月 29 日至 7 月 1 日在深圳宝安区前海 JW 万豪酒店举行,届时将会有 1 个主会场和 11 个专场(仿生机器人专场,机器人行业应用专场,CV 专场,智能安全专场,金融科技专场,自动驾驶专场,NLP 专场,AI+ 专场,AI 芯片专场,IoT 专场,投资人专场),意欲从产学研多个维度,呈现出更富前瞻性与落地性的会议内容。
今年的 NLP 专场上,我们邀请到哈尔滨工业大学教授、哈工大人工智能与中文信息处理方向带头人刘挺担任专场主席,他将会与雷锋网携手以全新的方式,带来一场一年一度的视听盛宴,让大家在感受到浓浓学术氛围的同时,了解到产业界的思考,洞察到未来的发展趋势。
NLP 专场已确认嘉宾如下,更多嘉宾还在确认中:
孙茂松,清华大学计算机科学与技术系教授
赵军,中国科学院自动化研究所模式识别国家重点实验室,研究员
秦兵,哈尔滨工业大学教授,社会计算与信息检索中心副主任
钟黎,腾讯知文算法负责人
张瑞飞,神州泰岳大数据 VP
张文斌,云孚科技创始人兼 CEO
翁嘉颀,竹间智能 CTO
熊琨,薄言 RSVP.ai 联合创始人及 CTO
2018 年 7 月 1 日上午,我们将在 NLP 专场,与大家共同探讨自然语言发展与未来。
评论留言