【参赛创意】方言募集群众游戏
j****o · j****o 发布于2015-11-26 07:27 浏览:369 回复:0
没有标准读音,没有文字,的 “各地方言看图识读”游戏。由大众告诉平台每个“认读卡”不同方言的图片的读音,贡献有礼;同时扩展更多的 “看”,“听”,“读”之间的互动游戏。

第一代(这个年代的电脑不够快,等于是电脑的婴儿时代)

  不用认字卡,而用 认图卡,的小游戏;

  图片多张(用文字来结合百度图库),让大众提供各种方言的读音;

  每一张卡一个单词(不显示的单词),但有大众看了觉得是怎么读的;然后,编码入库;系统去识别  相似读音(字数、抑扬、鼻音、舌音) 的统计,排序浮出相对多的几个读音;

  同时,使用此数据库播放,4图选一的打分,来统计语音与图片的关系;


第二代(加上贡献有礼之后 的3-12个月收集到的大数据)

  提供方言的即时转换工具;

  提供方言方案给硬件商开发翻译机,聋哑人士阅读机;

  提供外语游戏;

  语音编码系统第一版本落地。


第三代(24个月内)

  有着语音大数据,“语音编码系统”3.0 可以落地,基本上涵盖所有中文方言。语音编码后,保存语音数据库的就不用保存庞大的语音文件,而是编码后的字符串,让语音更有效率的保存、比较相似度。

 与文字系统的 兑换;这个周期文字的语义识别可以到达40%-50%;语音的编码系统就可以大规模发展。


第四代(量子电脑的使用)

  加上一直从单词扩展 到 短句的 图片(或视频)(文字标签的)与读音(编码) 关系数据库,利用量子电脑就能从 多次重复的 “视觉” 与 “听觉”里产生学习匹配;而量子电脑的第二部分,就开始队 图中物,远近,空间,物体的体会。

这就是人类的 6-12个月大能做的事了。


人类除了 视觉和听觉外,因为婴儿时期,有2只眼睛、有身体触碰、有被移动的空间感,所以,比电脑会学得更快;但是电脑因为有大数据,很多人对很多图片视频 的单子短语 产生重复的经验,所以电脑会 “识物”会更快。


这个比赛里是说语音开发,其他传感部分和机械部分就不讨论了。语音发展就是 识别为语音编码 与 语音编码到语音;再发展就是 语义了。但是语义之前,就需要学通识,所以,认字、认图是必须要的过程;百度已经拥有全国最大的图库了;缺的就是最大的语音库。毕竟80年代从 IBM PC/XT 和 Apple I 都只有 “哇”一声,就注定了电脑不是用 声音来操控的;所以电脑募集语音数据库,就必定是要找借口,那就必然是 

1.专家提供的语音识别或翻译工具;

2.声音编码后匹配的 语音识别游戏。


毕竟读音会随着每个时代的人口习惯,会不停改变的,所以这个语音智库,就会想百度引擎一样,不停更新。


我的设计核心,目的就是募集数据。为着我们一定会做到的即时对话机器人进发的过程而设计的。


我们利用这个大时代,就可以有别于80年代IBM的语音识别软件,设计就应该是,用大众来提供元数据;用大众的舆情值来评审;用大众决定最标准的读音是什么。




点赞  ( 0 )
收藏
评论(0)
TOP