造芯者胡郁:用半生来阐释「从 0 到 1」的 AI 攻城人( 二 )


胡郁在讯飞的一路成长 , 在 2005 年是一个重要节点 。那一年 , 科大讯飞成立了研究院 , 胡郁担任研究院执行院长 , 如今来看 , 这是国内第一个企业 AI 研究院 。
那一年 , 胡郁才 27 岁 。
当时的一个大背景是 , 科大讯飞在业务方向上看中了运营商的“彩铃”业务 , 这个业务需要解决的问题是语音识别问题 。但科大讯飞的专长是语音合成 , 而非语音识别 。为此 , 科大讯飞选择了与全球语音巨头 Nuance 合作 , 成为 Nuance 的代理 , 并且获得业务成功 , 最后在 2008 年上市——此为后话 。
其实 , 在上述业务一路发展的过程中 , 科大讯飞其实也深刻意识到自己在语音技术上对 Nuance 的依赖不可持续 , 因此需要建立起科大讯飞自己的语音识别研发力量 , 而要单开语音识别这条线 , 刘庆峰得先找一个业务带头人 。
这个人 , 就是胡郁 。
胡郁开始做语音识别的一个契机是 , 当年他妻子在香港大学霍强教授处读博士后 , 想让胡郁跟着去陪读两年;霍强教授也是王仁华教授的学生 , 当时在语音识别领域已经形成自己的江湖地位 。于是 , 刘庆峰去找老师王仁华商量 , 王仁华给了一个建议 , 胡郁在给妻子陪读的同时给霍强做研究助理 , 借此开始建立起科大讯飞在语音识别的班底 。
于是 , 2005 年至 2007 年 , 胡郁给霍强当了两年研究助理——多年后谈到这段经历时 , 胡郁的说法是:“我在香港搞清楚了国际一流的研究怎么做这个问题 , 并经常把从港大学到的新东西及时带回内地 。”
2007 年 , 霍强从香港大学转去微软亚洲研究院后 , 胡郁又去找王仁华教授的另一个学生江辉合作 , 江辉也是科大讯飞创业 18 罗汉之一 , 是当时中科大 BBS 上黑客版的版主 , 比刘庆峰高三届 , 因去东京大学读博士离开 , 后来又回到科大讯飞 。
此外 , 在语音识别领域 , 科大讯飞也选择与清华大学王作英实验室合作 。就这样 , 胡郁三箭齐发 , 开始逐步组建起科大讯飞在语音识别领域的团队 。
造芯者胡郁:用半生来阐释「从 0 到 1」的 AI 攻城人
文章图片

文章图片
左林大叔&胡郁
2008 年 6 月 , 胡郁更进一步 , 担任科大讯飞公司高级副总裁、讯飞研究院院长 , 负责领导科大讯飞公司语音合成、语音识别、语音分析、语音评测、声纹语种、语音信号处理等智能语音核心技术的研究及公司整体经营管理 。
八年后的 2016 年 , 科大讯飞在国际语音识别大赛 CHiME上 取得全部指标第一;而在认知智能领域 , 科大讯飞又相继获得国际认知智能测试全球第一、国际知识图谱构建大赛核心任务全球第一等成绩 。
3
第三个从 0 到 1:
让 To C 站在 AI 商业链顶端
对于胡郁来说 , 他在讯飞的第三个重要台阶 , 是 C 端业务 。
毕竟 , 移动互联网随着 iPhone 的推出开始爆发 , 语音行业江湖掀起大浪潮 , 科大讯飞也感知到了这个趋势 , 于是它先是推出了“讯飞语音云”平台 , 又在随后上线了 Android 和 iOS 版的中文语音助手讯飞语点——当然 , 讯飞也与三大运营商达成合作 , 试图把握住移动互联网的机会 。
一直以来 , AI都是以 To B/G 的形式对外赋能 , 而在 To C 场景中鲜有成功的产品 。
对于刘庆峰和胡郁来说 , 一直非常重要的是 , 如何让讯飞的技术触达更多的 C 端消费者 。
对此 , 胡郁的说法是:“光凭技术很难成就一家真正伟大的公司 , 而技术创新、产品创新和商业模式创新都要天时地利……科大讯飞也是这么多年积累了一个成体系的技术体系 , 在这样的基础上 , 我们决定向 C 端输出” 。