英库在微软拼音输入法和故事
作者:Matt Scott(Matt Scott),拼音输入法英库开发总监和项目经理,微软亚洲研究院的高级发展总监。
翻译:刘伟鹏,拼音输入法客户端因科负责人,微软亚洲研究院的软件开发工程师。
因科微软拼音输入法的开发团队自述,我们为什么要开发一个新的中文输入法;。
作者Matt Scott(Matt Scott),拼音输入法英库开发总监和项目经理,微软亚洲研究院的高级发展总监。
输入法的历史与现状
汉语输入法历史悠久。在个人电脑的出现(至少从上世纪40年代),发明家开始从事电子及机械中文输入的出现和普及电脑,我们也迎来了在中文输入法的技术创新浪潮,中文输入法的终极目标是输入效率,并竞争的焦点是在性能、精度和实用性。Ldquo;输入法(输入法编辑器或IME)是Windows 95的第一个学期;Windows 95还配备了微软拼音输入法的第一个版本(拼音输入是汉字输入法的主流形式,现在从Windows 95)。,在过去的18年里,输入法已经飙升,无论在技术和计算机竞争。
今天的输入法市场竞争十分激烈,国内和国际的软件公司参与竞争,尤其是公司提供的在线服务。他们参与的原因很简单:对于绝大多数中国用户,输入法是一种入口。在过去的十年里,随着网络和云计算,云输入法有了许多公司提供在线服务的机会。每个人都希望在6亿中国互联网用户进入辩论的一杯羹,和巨大的商业机会是不言而喻的。
问题、趋势和机遇
人们可能会想:因为微软有一个产品的输入法(微软拼音输入法),为什么微软亚洲研究院称为英库拼音输入法的新输入法。特别是在输入市场这样的世界已经是定局了。
答案很简单,那就是,我们认为中文输入法的问题还远远没有解决。随着互联网时代的兴起,我们发现更多的运用语言的过程中,在互联网时代的沟通更多中国用户的习惯和趋势,极大地改变了一些传统的中文输入方法此外,除了突破研究领域的自然语言处理领域中,我们认为时间迎来中文输入法的下一代核心技术终于到来了。
首先,网络时代的新的用户需求。例如,我们注意到,中国用户的频率逐年增加,中英文并用迅速增加。今天,大约有3亿2500万中国人在学习英语。2025,说英语的中国人超过预期在世界其他地区的本土母语为英语的人的总数。
然而,尽管有如此多的人在学习和使用英语,我们发现中文输入法可以提供有效的英语输入功能和友好。我们相信,对于中国用户来说,输入法是辅助英语输入的最佳方式,因为我们已经熟悉的输入法,我们可以用很多相关技术落后输入法。
另一方面,在英语世界的语言也发生着日新月异的变化,以及语言的跟踪,一个英语单词是大约每98分钟系统估计。这些话没有常见的翻译,在一些专业领域这种现象尤为明显,例如,软件技术书籍。拿起软件技术的书时,你可以看到一堆英语。英语现在是中国人的日常语言的一部分,甚至是必要的领域。在这种情况下,是我们的中文输入法不应该跟上中英文混合的趋势,并提供一个更好,更流畅,新鲜的、准确的英语和汉语之间的混合输入的经验吗
此外,促使我们做英库拼音输入法是其中一个重要原因。现在当我们在线交流,我们会发现,沟通的内容已经超越了简单的文本,包括图片、视频、音乐、地图等等ldquo 丰富的媒体内容。数以百万计的互联网用户沟通每一天,发微博,写博客,甚至使用这些非文件中的文本内容。值得注意的是,内容往往是通过搜索。
所以,所以,为什么当我们需要将它们粘贴,离开输入上下文,跑去打开浏览器,输入网址,输入关键词搜索,在搜索结果(图片、地图等等)来复制和粘贴这充分影响输入流经验,打断了我们宝贵的关注。为什么我们不能在输入法做的整个过程中直接
这不离上下文流畅体验是有效输入的灵魂。我们现在知道,输入法是所谓的主流云;候选词;也就是说,每一个输入框相当于搜索框,既然如此,为什么不把搜索内容从纯文本扩充在其他形式的丰富的媒体内容。想象一下,一旦整个互联网成为现实。可以搜索的内容就在你的指尖。
除了上述因素,我们认为,输入法的核心技术将迎来一个新的时代:更精确、更相关和更快的数据。就我们而言,我们中的两个核心技术很感兴趣:第一,我们的驱动输入法的核心引擎的新算法,而另一个是通过新的网络挖掘技术提高新鲜度和质量的数据,与顶级的自然语言处理研究结果来自微软亚洲研究院的帮助下,我们相信我们的输入法具有独特的竞争优势。
投入方法与创新
那么为什么微软亚洲研究院要做一种新的输入法呢首先,我们对任何技术挑战感兴趣,在一年内建立一种先进的输入方法,以便在一年内出版是一项挑战,此外,好奇心是我们的动力源泉。我们充满好奇,我们是否可以解决所有的输入法,今天我们看到的问题,并愿意尝试使用新的技术解决这些问题,优秀的工程能力和创新理念。输入法我们设想涉及计算机科学研究的许多领域:自然语言处理、网页搜索与数据挖掘、人机交互、语音处理、机器学习、云计算、图像和媒体,等等。
当我们看历史和输入法的现状,我们注意到输入法的创新也不可避免的要面对创新者的困境,和是(由哈佛商学院的Clayton M. Christensen提出),这背后的原因是,在一个成功的输入软件是一个非常复杂的技术,和更多的创新软件,越有可能会成功。然而,创新者的窘境指出,随着时间的推移,成功的,成熟的和复杂的产品将获得巨大的用户量,经过几年的迭代的软件版本,这不可避免地积累了各种水平的技术复杂性在创新的基础上,将不可避免地因此,实际发生的现象经常被称为持续创新,我们认为今天市场上投入法的大部分创新属于这种类型。
成功必须从零开始,对产品而不是市场关注的焦点,最终将成为创新者的困境解决的好,和这方面的努力,如果成功,其结果是被称为破坏性创新;(破坏性创新)。后者是英库拼音输入法项目意向我们做什么:研究,跳出了产品生命周期的限制,基于新的解决方案和新的用户痛点。
成果
到目前为止,英库拼音输入法项目的结果是非常令人鼓舞的。我们的自然语言处理研究人员改造实质上的中文输入,我们输入到翻译过程从拼音汉字,类似于从英文到中文的翻译。这些角度使我们有可能利用微软亚洲研究院的机器翻译领域10年以上算解决中文输入的问题。
包含中英文混合运输和其他辅助英语模式英库拼音输入法,它在机器翻译、语言内置的对齐,和必应词典(原名英库词典)独特的语音search,;功能(如敲fiziksphysics可以发现,英语拼音;一个样本),这些功能的起源可以追溯到我们的研究院的技术研究储备在汉语和英语在过去的10多年的自然语言处理。
汉英混合运输
最后,我们还对非文本类内容的输入进行了创新性的支持,我们称之为富候选人(富候选人)(对应于文本候选人),这让我们每天的输入超出了枯燥的文本,我们的灵感来自于搜索引擎技术。我们知道搜索引擎有即时问答,这是隐式搜索,而垂直搜索则对应于显式搜索。如果我们进入我们聊天的时候,嘿,嘿,那么你可能想表达的心情很好,所以我们的输入法能够自动给一些候选人如图片、表情等可直接插入对话。和显式搜索是什么类型的内容用户手动选择:中国英文翻译,严的文本、地图等。
富考生翻译中文英文地图
团队背景与软件开发理念
我们的团队是一个多部门的合作,从一开始的:研究人员和产品开发人员一起工作。中文输入产品部和微软亚洲研究院一起,最终发展为英库拼音输入法。从产品部门的帮助使得我们的软件开发过程相当顺利,几乎是直接从实验室产品。
我作为项目发展总监,你会觉得更奇怪mdash;mdash;为什么要由外国人领导的一个中文输入法的发展是答案,虽然我不是中国人,但我对中国语言和文化有着真诚的爱。虽然我不是中国人,但我的心中国。我为什么说我的童年是在Fala度过的,纽约,和法拉盛吸引了许多亚洲移民和有一个强大的亚洲口味。我的童年是由汉语和中国文化的影响。
能够引起英库拼音输入法的发展,我感到非常高兴。另一方面,我认为,作为一个中文输入法;局外人;我也带来了一些新的观点,我们的团队。另外,因为之前我也因科(翻译和语言学习)项目,并从字典输入法,自然语言处理中的一样,所以我也就自然而然地成为这个项目发展总监。
英库拼音输入法项目是在想着我的改变,必须跳出当前的输入法在鸟巢。我们必须与行业内的其他参与者不同,必须大胆,不落俗套的解决的挑战。另一个要素是团队必须由高级软件工程师,研究人员和设计师。事实上,我们还聚集了一批最强大的人,mdash;mdash;mdash和mdash,谁有欲望和改造世界的能力,创造最佳的输入技术。
我们的发展理念很简单:发布更多,学习和提高的释放。我们的改进主要是基于服务器端的智能数据采集和分析,而不是传统的焦点小组,我们的方法被称为实践驱动的研究;(部署驱动的研究),这是在研究领域的敏捷方法。
一个计算机科学实验室面临的共同问题是,它不是那么贴近实际的用户。除了在技术进入市场的时间延迟,实际用户反馈的缺乏会导致缓慢或偏见的研究。我们的为驱动的学习实践;哲学是解决这个问题,所以我们的产品迅速推向市场,得到的反馈给我们的团队带来很大的启示,并决定我们如何花费的时间和精力,因为后者是非常重要的。基础研究的难点之一是如何选择,并以实践为研究的动力;给我们指路明灯。
未来的沉思
未来始于历史。历史上,该输入法的破坏性创新突破;基于用户体验和输入效率。从研究的角度来看,例如,人机交互,我们可以看到,自然用户界面;未来的课题。在这意义上,输入法的未来也可以想象。它将越来越用户体验。Rdquo将自然直观地为用户提供丰富的各种输入场景体验,完美的输入方式应该是无论输入场景和内容类型,它都会感觉流畅,没有任何思想阻塞和负担。
工业和研究领域的大数据之间的另一个路口,和机器学习技术来构建输入系统,可以处理大量的数据。最终,对于用户来说,这意味着更少的敲击带来更多的投入。随着移动设备与不屈不挠的飞速发展,如何在移动设备上实现更高效的输入体验,不仅是一个用户体验,也是一个关键的技术问题。从这个角度来看,我们都非常期待触觉的进步(Chu Jue)、自然用户界面和多模型融合研究,可以带来更多的成熟的模式,使我们能够充分利用大量的输入上下文信息。
最后,就发展趋势而言,我们认为应用程序(扩展应用程序)也将在未来的输入方法中发挥重要作用,也就是说,输入方法将被视为一个平台,而不是一个复杂的各种复杂技术的集群。构建输入法应用开发平台,将使无数的开发人员为输入法的未来发展提供强大的合力。