科大讯飞成北京冬奥会智能语音及翻译独家供应商

  9月16日上午,在位于北京石景山区的北京冬奥组委会驻地,北京冬奥组委会与科大讯飞联合举办“沟通,因爱而能”发布会,宣布科大讯飞正式成为北京2022年冬奥会和冬残奥会官方自动语音转换与翻译独家供应商。   “冬奥会和冬残奥会的举办将给世界一个更深入了解中国的机会,无国界、无障碍沟通事关重大。”冬奥会奥组委技术部部长喻红在发布会上表示,相互的沟通和理解,才能更好地团结,“科大讯飞为此提供了新的解决方案”。   “安徽人许海峰拿到中国奥运会上的第一块金牌,成为民族的骄傲;如今来自安徽的人工智能企业科大讯飞将以先进的语音技术为奥运会添彩。”发布会上,科大讯飞董事长刘庆峰表示,成为北京2022年冬奥会和冬残奥会官方自动语音转换与翻译独家供应商,科大讯飞将以精益求精的智能语音及机器翻译技术为这两项赛事提供服务,助力各国友人在北京2022年冬奥会和冬残奥会期间“沟通无障碍”。   记者了解到,目前科大讯飞的语音转换与翻译技术已应用于消费者领域的多个方面,包括讯飞智能办公本、讯飞输入法、讯飞听见系统、讯飞翻译机等多款集语音识别与转化、翻译技术于一体的产品。今年5月,该公司还发布了讯飞翻译机3.0版本,在新增加的7大行业AI翻译场景中,“体育”位列其中。   值得一提的是,在今年8月底于上海举办的世界人工智能大会上,科大讯飞新一代语音翻译关键技术及系统刚刚摘得SAIL奖唯一一项“应用奖”,该奖项是人工智能领域国内最高规格的官方奖项,被誉为“人工智能领域奥斯卡”。

Read More

摘要翻译、抄袭检测……人工智能延伸科学交流触角

  近日,一款看起来挺有文化的写稿机器人上线了。它叫小柯,由中国科学报社和北京大学科研团队共同研发。   小柯写的不是普通的稿子,而是中文科学新闻。据介绍,运用自然语言处理技术,小柯以英文论文摘要为基础,能够快速写出中文科学新闻底稿,然后由专业人士和报社的编辑进行把关和信息完善,帮助科学家以中文方式快速获取全球高水平英文论文中的最新科研进展。   科技日报记者发现,7月5日,小柯机器人发出第一篇稿子,截至8月22日记者统计时,小柯机器人共发稿415篇。初期更新时间距论文发表时间间隔一个月左右,现在可以做到当天或隔天更新,每天更新几篇到二十几篇不等。所选论文来自生命科学等领域,涉及《自然》《细胞》《新英格兰医学杂志》等期刊。   记者对照分析了小柯作品《单细胞测序揭示冠状动脉疾病保护机制》及其英文原文。新闻中,小柯先对论文主题、研究单位以及发表期刊进行简单介绍,后接英文原文摘要的翻译,大致反映原文内容;翻译时会对原文进行适当的语句简化,同时在对专业词语的翻译上也使用了如“血管平滑肌细胞”“保护性纤维帽”等专业表述。   不过,这也不全是小柯的功劳,因为稿件发出前,还有人工审校这一步骤。北京大学计算机科学技术研究所研究员万小军团队负责小柯的系统总体设计与联合技术攻关。他告诉科技日报记者,目前机器翻译系统的性能很大程度上依赖于其所使用的训练数据,即平行语料。目前的平行语料多为新闻语料,因此训练得到的机器翻译模型对于日常新闻的翻译效果较好。但学术文献(比如生物学术论文)与日常新闻在用词造句等方面都有较大差别,机器翻译系统对于学术文献翻译的效果并不理想。   这一次,他们通过融合领域知识进行语句智能筛选,选择适合大众理解的语句,并基于语句简化提升语句翻译质量。“英文学术论文摘要适合专业科研人员阅读,但摘要中的语句并不都适合写到科学新闻中面向大众传播,因此需要结合编辑提供的先验知识,采用计算机算法对语句进行筛选,保留适合进行大众新闻传播的语句。”万小军说。   研发小柯用了半年时间,万小军表示,和一般写稿机器人相比,一个好的跨语言科技新闻写稿机器人需要进行两次重要的信息转换过程:一次是不同语言的转换,将英文文本转换为中文文本;另一次是语言风格的转换,将学术型文字表达转换为大众能够接受的通俗文字表达。“这两次转换都具有较大的挑战性,目前并没有完全解决。后续还需要进一步积累数据,调整算法模型,才能取得更好的效果。”万小军说。   接下来,团队还将继续优化小柯,让它写出的科学新闻内容更丰富,表达更生动。   当然,翻译撰写科技新闻稿件,只是自然语言处理等人工智能技术在学术交流中所能大显身手的领域之一。   “基本上,只要人类交流和工作过程中涉及到语言和文字的地方,自然语言处理技术都有可能发挥作用。”万小军说,在科研论文写作过程中,可以借助自然语言处理技术帮助推荐参考文献,并自动生成related work等章节的文字;业界也有基于自然语言处理技术自动编撰图书的尝试。“我个人也接触到很多很有意思也很有挑战的应用需求,但可惜的是不少需求都无法基于目前的自然语言处理技术进行实现。自然语言处理技术还需要进一步地发展和突破,我相信在未来将有更多的用武之地。”   中国知网常务副总经理张宏伟长期关注自然语言处理,大数据和人工智能方面的应用研究。他告诉科技日报记者,在数字出版和知识服务的全链条中,你都能看到人工智能和机器学习技术的身影。   人工智能可以对数字出版的选题策划、协同撰稿、内容编审进行赋能。大数据标注机器人则能对海量文献信息资源进行OCR文字识别,智能版面分析,知识元抽取,自动分类,自动标引主题,自动生成摘要,自动翻译,自动标注引用和参考文献。   人们熟悉的论文抄袭检测,同样需要智能技术。它不是简单的语句重复检测,而是要对文本内容(包括图片、公式、表格等)进行语义索引,“看你在思想上有没有抄袭别人”。如果存在不同语言之间的互抄,还需要动用“机器翻译”。张宏伟表示,初级的语义抄袭可以由机器揪出来,不过,如果足够有“心机”,完全用自己的语言“洗”了别人的思想,对人工智能的技术要求一下就提高了许多。目前已有利用神经网络模型对文本内容构建高维度语义索引等新技术出现,不管是中文还是英文,一律映射到一个统一的语义空间,实现真正基于内容理解的语义级全文比对检索。   张宏伟说,数字出版和数字图书馆的资源类型非常丰富,有大量文本、图像和音视频数据,且数据是非结构化的,若想对其进行深度的挖掘利用,难度不小。   就拿常见的信息检索来说,首先得做到结果要全,相关度要高;再进阶一步,能不能用自然语言交互的方式检索;升级一下难度,用智能问答的方式查找信息,能否直接给出答案?“要让检索功能变得更贴心,计算机要‘学会’阅读资料,总结、推理然后回答。它需要把海量的数据资源变成自己可以理解的知识库。”张宏伟说。   深度学习等统计方法严重依赖于大样本数据,然而,现实世界中,很多实际问题仅仅依靠统计方法是无法解决的,这就需要建立专门的计算机能理解的知识库,实现真正的人工智能。但构建知识库,本身是一项极其艰难且耗时漫长的工作。毕竟,机器和人对知识的理解方式大相径庭。   张宏伟说,像知网这样的机构正在致力于深度整合全球知识信息资源,建设世界知识大数据。也在让文本文献碎片化、网络化,依据知识使用的场景,采用半自动知识抽取算法来构建面向垂直领域的知识图谱。2019年知网陆续推出了一些基于知识图谱的行业智慧应用产品,如医疗领域的临床智能诊断,法律领域的智能量刑判案等。   “不过,我们在这些领域刚刚起步。我个人觉得,还是要少一点浮躁,踏踏实实做一些基础性的工作。没有知识的支撑,就谈不上‘智慧’。” 在张宏伟看来,知识库和人工智能,本身就是互相促进、相互赋能的关系。构建知识库需要人工智能,而人工智能的发展,也离不开知识库。怎么将人类的知识库转换成计算机能理解的知识库是人工智能的核心问题,面临许多困难,需要学术界和产业界共同努力。(张盖伦)   新学期第一周,位于湖南湘西土家族苗族自治州花垣县双龙镇的十八洞小学书声琅琅。这所苗寨深处的山村小学目前有2名教师,设立学前班、一年级和二年级,共有学生22名。新华社记者 陈泽国 摄十八洞小学一年级学生杨韩雪在下课后打扫教室卫生(9月4日摄)。   9月5日,在斯里兰卡科伦坡,处于始发状态的盾构机在地下排水隧道工程现场就位。由中国石油管道局工程有限公司承建的斯里兰卡首都科伦坡地下排水隧道工程5日正式开工。新华社记者 唐璐 摄   9月4日晚,在意大利雷焦艾米利亚市,中国杂技团演员表演杂技。由中国侨联主办的“亲情中华”慰侨演出4日晚在意大利雷焦艾米利亚市政歌剧院举行。由中国侨联主办的“亲情中华”慰侨演出4日晚在意大利雷焦艾米利亚市政歌剧院举行。   9月5日,在越南首都河内,一所小学的师生参加开学典礼。当日,越南全国逾2400万名学生迎来新学年。新华社/越通社9月5日,在越南首都河内,一所幼儿园的儿童参加开学典礼。   美国官员说美国正与也门胡塞武装对线日,在沙特首都利雅得,美国负责近东事务的助理国务卿戴维·申克尔(右)参观一处军事设施。美国负责近东事务的助理国务卿戴维·申克尔当天参观了位于沙特首都利雅得以南约80公里的一处军事设施。   黄河岸边,吕梁山上,一位老师,六名学生,组成了一所特殊的“麻雀小学”。今年39岁的王福平从2001年开始乡村教师生涯,先后在高家沟乡的多所乡村小学任教。在条件艰苦的乡村小学里,乡村教师王福平不离不弃的坚守,让山里娃有了学习的机会。   近年来,江苏省昆山市大力推进乡村振兴战略,打造农村生态宜居环境,实现农业增效、农民增收、农村发展活力增强的良好局面。新华社记者 林善传 摄在河北省故城县郑口镇果子口村化肥农药减量增效示范基地,工作人员操作无人机给小麦施肥(4月1日摄)。   这是9月4日在新疆塔城地区巴克图口岸拍摄的丝路文化商品城外景。巴克图口岸位于中国西北部新疆塔城地区与哈萨克斯坦交界处,距离塔城市12公里,已有200多年通商历史,是丝绸之路经济带上的重要节点之一。   8月23日,游客在上海市南京路步行街上排队购买现烤现售的散装月饼。平价的散装月饼受到消费者欢迎。新华社记者 陈飞 摄8月23日,游客在上海市南京路步行街上排队购买现烤现售的散装月饼。

Read More

科大讯飞发布翻译机30 Lite

记者8日从科大讯飞在北京举行的媒体沟通会上获悉,日前,科大讯飞旗下消费者产品讯飞翻译机跨界与西班牙甲级联赛俱乐部及效力于该俱乐部的中国足球运动员武磊签约合作,并打出“译起向世界出发”的品牌理念。签约后,武磊成为科大讯飞翻译机首位品牌代言人,讯飞翻译机则成为皇家西班牙人足球俱乐部官方翻译合作伙伴。 签约当日,科大讯飞正式发布了讯飞翻译机3.0 Lite。据介绍,讯飞翻译机3.0 Lite目前支持的可与中文互译的外语种类已达到58种,覆盖200多个国家和地区。此外,讯飞翻译机的中英离线%,接近于大学英语六级水平。 武磊代表着国际足坛上的“中国面孔”,是《世界足球》杂志评选的世界500名最重要的球员中唯一上榜的中国球员。选择签约武磊,科大讯飞副总裁章继东解释道:“武磊在赛场上的实力表现和奋勇拼搏,与讯飞翻译机的专业和坚持有共通之处。”(赵广立)

Read More

Science子刊:揭示雄激素受体在晚期前列腺癌中的作用

  2019年8月10日讯/生物谷BIOON/—前列腺癌是指发生在前列腺的上皮性恶性肿瘤。2004年WHO《泌尿系统及男性生殖器官肿瘤病理学和遗传学》中前列腺癌病理类型上包括腺癌(腺泡腺癌)、导管腺癌、尿路上皮癌、鳞状细胞癌、腺鳞癌。其中前列腺腺癌占95%以上,因此,通常我们所说的前列腺癌就是指前列腺腺癌。发病随年龄而增长,其发病率有明显的地区差异,欧美地区较高,亚洲地区发病率较低。前列腺癌的发病率和死亡率仅次于肺癌,位居癌症死亡的第二位。在大多数病例中,前列腺癌在年龄较大的男性中发展缓慢,并不会导致死亡。   雄激素受体(AR)是细胞分化和前列腺癌产生的一种驱动因素,也是前列腺癌的一种常见的治疗靶标。大量的研究工作将这些正常和异常的细胞过程与mRNA转录相关联在一起;然而,雄激素受体调节转录后基因调控的程度仍然未知。   在一项新的研究中,来自美国弗雷德哈钦森癌症研究中心、华盛顿大学和纪念斯隆凯特琳癌症中心的研究人员证实雄激素受体利用翻译复合物塑造细胞蛋白质组。他们发现雄激素受体是蛋白合成的一种负调节因子,并且鉴定出雄激素受体与体内翻译起始过程之间存在一种意想不到的关联性:这种受体的缺乏与增加的翻译起始相关联在一起。这是通过对翻译抑制因子4EBP1进行直接转录控制来介导的。这一观察结果有助于解释缺乏雄激素受体的晚期前列腺癌的快速生长。相关研究结果近期发表在Science Translational Medicine期刊上,论文标题为“The androgen receptor regulates a druggable translational regulon in advanced prostate cancer”。   这些研究人员证实降低雄激素受体丰度会增加eIF4F翻译起始复合物的组装,从而促进增强的肿瘤细胞增殖。   此外,这些研究人员揭示了一个以富含鸟嘌呤的顺式调节元件为特征的促增殖性mRNA网络,这种顺式调节元件对eIF4F活性过高特别敏感。通过使用遗传手段和药物方法,他们证实eIF4F复合物的解离可逆转这种增殖程序,从而导致肿瘤生长减少和临床前模型中的存活率提高。   这些研究结果揭示了一种可药物靶向的相关性。在一类缺乏雄激素受体的前列腺癌中,这种相关性在功能上将mRNA转录过程和翻译起始过程关联在一起。(生物谷

Read More

走进公众科学日听听科技迷们怎么说?

5月18日-19日,中科院第十五届公众科学日如约而至,一大批中科院国家重点实验室、植物园、天文台站、博物馆、野外台站、大科学装置等向社会公众开放。作为中科院的品牌科普活动,公众科学日已成为公众了解科技进展、探索科学奥秘的重要平台。今年公众科学日的主题为“科技强国、科普惠民”,向社会全面展示中科院近年来的重大科技创新成果和重要科学进展,全面展现科学研究在服务国家发展、创造美好生活、塑造人类未来等方面的重要作用,让公众感受浓厚的科学文化氛围。今年的公众科学日吸引了众多不同年龄段的科技迷参与,对于这场科普盛宴,听听他们怎么说。(视频拍摄、剪辑/ 王莹 )

Read More