艾瑞深中国校友会网|2003-2016中国大学排行榜|关于我们

中科大讯飞总裁刘庆峰:中文语音产业的领导者与拓荒者

艾瑞深中国校友会网  http://www.cuaa.net   微信公众号:艾瑞深研究院    
分享到:
       
[艾瑞深研究院中国校友会网赵德国、蔡言厚和党亚茹主编“中国高考考研志愿填报指南—《2017中国大学评价研究报告》(ISBN:978-7-5629-5598-6)”已面向全国公开出版发行]
中科大讯飞总裁刘庆峰:中文语音产业的领导者与拓荒者

(2005-09-07 14:37:12)

近年来,高科技的发展使得键盘鼠标上的“指间交流”占据了生活中越来越多的时间,但语言仍是人们获取和交流信息最方便、最有效的手段,如今跨越了诸多技术障碍,语音识别和语音合成技术的应用已经开始深入到人们生活的方方面面。在第九届中国国际软件博览会上,安徽科大讯信息科技有限公司的Interphonic 4.0、公安基层办案综合信息系统、声动炫铃系统三项软件产品,同时被授予最高奖“2005 中国国际软件博览会金奖”,成为展会的最大赢家。顶尖的学生、优秀的科学家、成功的企业家、年轻的总裁,诸多身份的转变造就了这位我国语音产业功勋卓越的开拓者——中科大讯信息科技有限公司总裁刘庆峰。

学生创业 放飞梦想

1990年刘庆峰进入中国科技大学电子工程系,因为成绩优异且学有余力,1992年就被王仁华教授选入中国科技大学和国家计算机研究开发中心联合设立的人机语音通讯实验室。1995年保送上研究生,那时就开始担任该实验室承担的国家“863”项目“KD系列汉语文语转换系统”的主要负责人。

1998年,才华出众的刘庆峰和他的实验室伙伴们在研究生毕业时都有机会获得当时人们心目中的最佳选择:进世界一流大学留学深造或是进入外企成为高薪白领,但是最终他们都放弃了。谈到当时的选择,刘庆峰说:“上世纪90年代国家在搞语音产业时,‘863’专家组主持的文语转换评测系统将各个公司的语音技术按5分制打分,计算机念的和中央广播电台最好的播音员一样,就可以获得5.0分,像普通人一样标准流畅的是4.0分,达到可接受的程度就是3.0分。我们实验室在历次的评比中都是第一名,1998年第一次达到了3.0分,这说明可以走向市场去应用了。而且,当时我们有很多创新性的想法,例如计算机模拟人发音和听觉感知的听感量化模型等,刚刚开始做,如果出国就半途而废,让我们觉得很可惜。创业要有人马,而当时的优秀毕业生几乎全都选择了出国留学。其实国内很多学科的研究也非常需要这些有创新活力的研究生。然而研究条件和个人待遇是大家都无法回避的留人障碍。如何解决?我们当时就清晰地意识到,必须走产学研结合的道路。当时我的构想是做中国的‘贝尔实验室’,把技术提供给联想、华为等公司,形成经济上自我造血的运转能力。假如能给每个博士生一个月发两万元,也许很多优秀人才能够安心留下。”

基于对语音产业广阔前景的信心,同时也是基于对语音研究事业的热爱和对自己创新能力的信心。1998年硕士毕业后,怀着满腔的豪情壮志,在科大的支持和导师王仁华教授的鼓励下,刘庆峰和他的伙伴们为了共同的梦想开始了艰难的创业之路。“有生活的地方就会有对语音的需求,当时我们坚信,齐心协力就可以成为这个巨大产业的领导者和拓荒者。”

在回忆讯飞公司成立的情形时,刘庆峰不由自主流露出的那份甜蜜和自豪,让人感动不已。那时,他们团队的18个成员,很多人不仅可以出国,而且即便在国内企业也能拿到很高的年薪,而他们当时在讯飞创业只拿很低的薪水,但大家都毫不犹豫地签署了三年劳动协议,没有一个谈报酬和福利的。现在6年过去了,还有15人在公司,且核心研究人员没有一个离开。这在当今人才流动率极高的IT产业中,可说是极为难得的。“我们是把科大讯飞当做一种事业,是为了自己的理想在奋斗。科大讯飞中文语音技术走在全国甚至全世界的前列,产业化能取得今天的成就,是我们这个团队不畏艰辛、整体协作打拼的结果。”

说到当时的选择,刘庆峰表情非常认真。“到国外一流的大学、研究院所进行学习深造,回来后为祖国做出贡献,是很多人向往并且获得了成功的科研报国之路。当时,我们的研究正处在突破性进展的关键时刻,许多创新性的研究方法也进行了一半,而且我当时已经是实验室所承担的国家‘863’项目的主要负责人之一,离开实验室,进度会受阻;加入到国外的大学或者科研院所,就可能与国内形成竞争。这是我无法面对,也无法接受的。”“在那个时候,我才真正感觉到一种神圣的使命感和责任心。如果出国了,恐怕损失的不仅仅是自己。”刘庆峰说:“一个国家在任何时候都要有一批有创新精神的知识分子成为这个国家的脊梁。如果我有幸在这个领域担当这个角色的话,那是我一辈子的骄傲。”

转变身份 整合资源

从学生时代开始就是顶尖人物的刘庆峰,当初的最大理想是建中国的“贝尔实验室”。在火炬计划国家十年展,“天音话王”人机对话产品和曙光2000CPU一道被选在了特展位上。

“当时我只想搞技术和产品,担任总工的角色,管理、市场、财务都交给了南方的一个合作伙伴。结果发现开发了很多产品但都卖不出去。”谈起这段往事,刘庆峰颇有感触,耗费一年心血,却发现自己犯了一个错误。如果经营者不懂技术的前瞻性和方向性,单纯的管理很难把握高科技创业公司的发展方向。没有非常清晰的产品战略、技术路线和未来规划,就会导致市场开拓没有目的,研发也会很吃力,失去了主导方向。如果要做到具有国际竞争力、能和微软这样的大企业平起平坐,至少在某些局部领域可以一争高低,那么一定要由懂技术并且有很好的前瞻能力的人来主持工作,所以我们要成立自己的公司。刘庆峰深感从“知识”到“知本”的产业化之路必须自己走。

为了将自己的研究成果产业化,也为了给一群热爱语音技术的年轻人创造一个施展抱负的舞台,刘庆峰和伙伴们在1999年6月9日正式成立了安徽科大讯信息科技有限公司,注册资金300万元。从此以后,刘庆峰不断地将自己的科研成果和理想付诸实践。

说起从学者到企业家的转变,刘庆峰说:“我感到最困难的就是心态的转变。”从与单纯的计算机打交道到与形形色色甚至不喜欢的人打交道;从研究算法和编程的成就感到消耗大量时间去做一些“无谓”的行政事务的失落感,随着研究时间的减少,刘庆峰觉得内心十分痛苦。

怀着对语音产业执着的信念和创业伙伴给予的信任,刘庆峰坚持了下来。1999年底,科大讯飞获得了第一笔3000多万元的投资资金,并利用这笔资金与国内在中文语音领域积累最深厚而又最具优势互补的3家单位——中国科技大学、中国科学院声学研究所和中国社科院语言研究所成立紧密型联合实验室。半年后,刘庆峰终于克服了心理上的落差。“我们利用资金和市场优势还吸纳了更多优秀的青年人,他们不再出国、去外企,他们和我们一起来做语音研究和产业,这比我一个人做要快得多,以前我只是一个神枪手,现在我更像一个元帅,指挥更多的神枪手瞄准一处去打。”

语音产业是一个典型的交叉学科,中国科技大学、中国科学院声学研究所和中国社科院语言研究所在数字信号处理学、声学、语音学各有所长。但当时他们不仅要在专长的领域保持领先,还需要做完整的语音产品,花费很多时间在不擅长的研究和市场推广上。国内许多研究机构都因为资金缺乏举步维艰,很多研究人员纷纷出国,有些研究小组甚至被国外研究机构连根挖走。刘庆峰通过企业机制、股权及奖金提成等方式对国内最优秀的语音产业的单位机构进行整合,使得各实验室专注于其擅长的研究,由讯飞统一实施产业化,从技术源头上聚拢了语音产业的资源。

为了牢牢地把握民族语音产业先机,刘庆峰还在推动标准制定,利用国际规则树立民族语音产业壁垒方面做了卓有成效的工作:在他的推动下,国家信息产业部、“863”专家组、国家技术监督局和国家信标委分别于2001年、2002年、2003年连续在科大讯飞召开了三届语音标准研讨会,并于2003年11月由信息产业部科技司正式下文成立“中文语音交互技术标准工作组”,科大讯飞作为组长单位,刘庆峰担任工作组秘书长。目前,语音合成和语音识别通用标准已正式立项为国家标准,报批稿已经完成,多个产业相关的应用技术标准也正在制定之中。

脚踏实地 不断变革

正如所有科技公司的创业史一样,讯飞的发展也充满了曲折和艰辛。1999年公司刚成立时所谓的“办公大楼”是租借的民房,暑假借用科大暂时不用的实验室。18个人的创业团队,夏天没有空调,吹着破旧的电风扇,大汗淋漓地做着实验,吃着最简单的盒饭,来过这里的人甚至说感觉不是和高新技术企业的人在一起,倒像是和一群民工在一起。1998年底最后一个月的工资是刘庆峰以个人名义向公司借钱,发给员工回家过年,非常艰难。

2000年初,融资刚刚完毕,社会和股东都对科大讯飞高度关注并充满期待。而当时的技术和市场尚处于起步阶段,公司的收入很少,而股东方面是要看效益的,刘庆峰背负了巨大的压力。有人建议做些挣钱的事,在安徽本地做一些信息化建设的项目、系统集成就能挣钱。刘庆峰顶住了,他坚持认为讯飞一定要坚持自己的理想和方向,关键是要有核心技术和核心产品的突破。讯飞开始定位在做语音桌面软件,后来分析后发现盗版的影响导致产业规模难以突破,此外桌面软件销售需要渠道管理经验和大面积的广告投放,这种产品方向不适合讯飞这种创业型公司。为此,讯飞适时变革,推出语音平台战略,通过为各行各业的开发商提供方便易用的语音开发平台,让华为、联想、东软、英特尔等各行业的领导型企业,把语音应用于他们所擅长的领域,并结成利益共享的语音价值链,让各行业熟悉这些行业应用的、有开发能力的厂商在他们的系统和产品里进行推广。2000年底,讯飞语音平台开发厂商达到了100家,迅速占领了语音应用的绝大部分市场,形成了以讯飞为核心的民族语音产业的价值链。

在新的领域中创业就像是在茫茫的黑夜中点燃一支最亮的火炬,要么率先燎原,要么很快熄灭,这是刘庆峰创业初期的深刻体会。创业初期,清晰的战略和路线设计让他豪气万丈,但在无情的市场开拓与竞争面前,他很快体会到启动一个全新市场的难度远比想象中大。股东的压力,员工的期待,这些无不鞭策着刘庆峰。这时他感觉自己就像一个在黑暗中前行的船长,一定要指引方向并始终鼓舞大家的信心。“私底下我常睡不着觉,如果不抓紧时间‘燎原’让火势更猛更烈,自己就要先燃烧殆尽。但我从未犹豫后悔过,就像种子一样,看不见它在地下生根发芽,但只要种子是好的,只要我们精心浇水施肥,它就一定会长成参天的大树来。”依靠着对语音前景的不断剖析、对战略路线的反复梳理并身先士卒地投入,科大讯飞终于一步步走出创业的最艰难时期,效益慢慢好起来了。2001年,刘庆峰号召让所有的创业者、投资人以及社会各界关心讯飞的人从过度乐观回到艰苦创业的心态,并且提出了“脚踏实地,说到做到”的口号,这是科大讯飞长久发展的根本之路。

发展迅速 前景广阔

“让机器像人一样能听会说”,这不是什么年少轻狂的豪言壮语,6年来,刘庆峰一步一个脚印地领着自己的团队实现着这个执著的梦想。

1999年6月成立时注册资本仅有300万元,2001年6月联想投资和火炬投资联手注资,使得科大讯飞的市值达到2.2亿元。短短两年内科大讯飞的资本增值70多倍!从2002年,讯飞开始实现赢利,并逐渐在手机、车载、通信增值这3个当今中国增长最快的产业领域内找到自己的立足之地,去年营业额超过了1个亿,实现税后利润超过了1000万元。现在,中国电子百强企业中用到的语音技术几乎都是讯飞的,讯飞在业界的优势地位牢不可破。

2001年11月,讯飞推出了第一块语音合成单芯片;同年12月,又推出了具有语音合成和语音编解码功能的板卡。这些产品可以用于PDA、手机、车载GPS、智能玩具、信息家电等嵌入式产品中。2003年,科大讯飞在业界首次将语音合成效果提高到超过普通人说话水平;2004年在大陆首次推出粤语合成和英文合成系统,并在多语种合成上取得突破;2004年底举行的新一轮国家“863”评比中,通过与日本ATR、清华大学等国际知名语音研究机构的最后角逐,InterPhoinc系统以大比分囊括所有指标第一名;在第九届中国国际软件博览会上,科大讯飞发布的最新一代的语音合成系统——Interphonic4.0首次在一个系统内同时提供多语种、多音色的语音合成服务,充分满足了用户对语音合成系统个性化和多语种的需求。今天,讯飞不仅在中文语音合成技术上取得了公认的国际领先成果,而且开始在语音编码、语音识别、文本处理技术等方面全面实现了赶超,优势领域也从中文日益拓展到多语种领域。

由于掌握着核心技术,在中文语音合成市场上,科大讯飞已经占据了绝对的优势。2004年底,讯飞语音平台开发厂商已经达到500多家,讯飞语音产品现已占领了语音合成主流应用市场80%的份额。讯飞语音不仅在中国大陆的近30个省份得到了推广应用,还成功地进入了我国香港、我国台湾和新加坡、日本、北美等市场,成功应用于电信、证券、银行、电力、教育等20多个行业,并被奥运会组委会和“863”专家组共同确定为“面向奥运的多语言信息服务系统”中的语音技术提供单位;被中国通信业第一大刊《通信世界》评为“中国通信业十大最具增长潜力企业”。同时,科大讯飞也被国家科技部认定为全国迄今唯一以语音技术为主要产业化方向的“国家863计划成果产业化基地”和“火炬计划重点高新技术企业”;2002年、2003年连续两年被国家税务总局、发改委、信息产业部和商务部联合确定为“国家规划布局内的重点软件企业”,并且都是全国语音产业中唯一入选企业,刘庆峰被著名的《财富》杂志评选为“中国商界明日之星”。

对于语音技术的发展前景,从行业部委到社会各界都有着非常乐观的估计,据国家发改委2002年度“‘十五’高技术产业化示范工程”项目专家组的谨慎评估,仅在社会信息服务、PC、手机、车载、玩具五个领域内,语音技术每年的核心技术应用市场总潜力就有50亿元人民币以上,带动相关产业500亿元以上。据《21世纪经济报道》和《香港文汇报》预测,语音技术在未来社会应用总潜力将达到1000亿元人民币。

面对广阔的市场前景和应用空间,500亿元到1000亿元的社会和经济效益,中文语音产业实际才刚刚呈现爆发趋势,冰山只露出一角。虽然目前讯飞已经从技术、产品、市场上全方位构建起领先优势,但国际IT巨头对中文语音产业的时刻窥伺,语音合成与语音识别及其他多媒体技术的紧密融合,中文和多语种融合的趋势,在研发、市场等方面都给讯飞提出了前所未有的挑战和机遇,经历过创业艰辛的科大讯飞对此充满信心。

在坚持技术创新与领先的同时,科大讯飞以卓越的战略眼光加强与国际巨头的合作。2005年3月,科大讯飞与微软合作组建了合肥微软技术中心;2005年4月,科大讯飞又与美国最大的电话识别厂商Nuance共同建立了联合实验室,引领语音应用步入“用效果说话,以应用增值”的新时代……讯飞正以一个接一个的大动作不断实现自己的目标:全球最大的中文语音和语言技术提供商和全球最出色多语种语音及语言技术提供商。“作为中国人,我们决不能失掉中文语音技术这块民族产业阵地,我感到强烈的紧迫感和使命感。产业的领导者又是产业的冲锋者,怎么去合理应用成熟的技术,如何引导客户使技术不断地达到实用化的要求是我长久以来一直思考的问题。”刘庆峰语气坚定地说。

寄语未来的学生创业者

1999年11月11日,大学生的智慧第一次转化为个人的巨额资产——以刘庆峰为首的中国科技大学6位大学生因为研制成功我国第一台“能听会说”的中文电脑,获得668.85万元的技术股权奖励,为被称作“大学生创业年”的1999年画上了一个大大的惊叹号。6年过去了,作为学生创业的领军人物,刘庆峰这样勉励新一代的创业青年,“创业是对一个人的综合素质的考验。国家在发展,高科技产业要进入国民经济的主战场,需要一批既骁勇善战又能指挥千军万马的元帅,这种元帅就是复合型的企业家——具有科学家思想的企业家,也是具有企业家思想的科学家。大学生创业,首先要有着不可遏制的创业冲动,对自己所掌握的技能或者对于一个产业的发展思考达到一个火候。高新技术产业大都不是已有的而是一个全新的产业,教育和引导新市场的难度比我们想的要困难很多。创业初期是技术取胜,发展到今天一定是战略取胜,形成技术路线、产品路线与市场路线相融合的全方位发展,能够制定清晰明确的战略规划,通过战略取胜,赢得长期整体的发展,而非仅靠机遇赚钱,获取局部暂时的利益;其次要有“一切以集体事业为重”的核心团队和心胸开阔、百折不挠的团队领导人,优秀的学生大都很有个性,棱角分明,但是企业家跟各种人打交道,要包容各种人才的缺点,带领千军万马去打仗,心胸要更开阔,要能顶得住来自各方面的压力。要用“亲情和激情”去感召大家,实现集体创业的理想;最后是形成自己独具特色的企业文化和管理机制。企业拥有真正的创新能力、独特的管理和文化,包括组织和自我造血能力是非常重要的,千万不要急于求成,只有经过几代人的艰苦创业,才能成就一个能够在全世界顶天立地的民族产业。

“弯曲,是指具体的路径非常曲折;直线,是指目标和战略的明确和清晰。总之,必须学会‘走弯曲的直线’。”这就是30岁出头年轻有为的刘庆峰成功的秘密所在。

(本报记者 马晓岚 张文婷) 艾瑞深中国校友会网(www.cuaa.net) 微信公众号:艾瑞深研究院

新闻动态

媒体报道 高校报道 创富新闻 教育动态 大学排行

  • 人民日报:清华大学凭借84位亿万富豪校友,夺下大学排行榜“造富”冠军

    日前,中国校友会网大学排行榜正式出炉,其中最受关注、也最惹争议的是杰出校友排行榜中的“亿万富豪”一栏:84名亿万富豪校友、财富合计近3000亿元,2012年清华大学超越北京大学,成为最会“造富”的学校。

  • 人民日报:中国校庆豪捐背后:学生对母校情感复杂多样

    随着时间推移,校友的捐赠金额呈现加速增长的趋势。据中国校友会网数据统计,仅一年间,北京大学的校友捐款总额就增加了9.25亿元人民币。不仅如此,个人校庆捐款金额也屡创新高。步步高董事长曾在2006年向母校浙江大学捐赠2.35亿元人民币。

  • 中央电视台:蔡言厚教授揭秘高考状元职业成就远低社会预期

    一年一度高考落下帷幕,最新高考状元即将出炉。面对媒体的追捧和社会期待,这个特殊的群体该如何走上成才之路?5月14日,中国校友会网发布最新《中国高考状元调查报告》,通过对恢复高考30多年来1100多名“高考状元”的研究分析显示:“状元”毕业后职业发展较少出类拔萃,职业成就远低社会预期。“高考状元”不杰出的结论立即引起社会的热议。新闻会客厅今日邀请《中国高考状元调查报告》课题组首席专家蔡言厚教授做客演播室

  • 中央电视台《新闻1+1》:高考状元:成功可以“复印“?

      央视《新闻1+1》6月26日播出《高考状元:成功可以“复印”?》,主要内容为:四川自贡考生林浩然在网上被传为高考状元,一时间,当地媒体纷纷采访其家人学校,探求其成功经验。