第258章 无心插柳柳成荫
“人景分离项目……” 叶晓奇心说,来了,认真的聆听状,对这个项目非常关心。 “目前遇到了一些问题,主要是由于图片集数据量不够,导致我们的在此基础上建立的特征库,识别准确度非常低下。同时由于美工设计师的不足,在人工剥离人像上也显得资源缺乏。” “唉……” 叶晓奇心里轻轻的叹了一口气,到此为止,最关心的两个项目,都遇到了各自的困难。一个是自身的不足,自动化基因缺乏。一个是世界性难题,深度学习需要海量的图片,世界各国的数据集都还在建,imageNet的数据集也还很弱小,中生代的勤工俭学数据集计划也才开展没多久。 “所以针对这两个问题,我们基础架构研发部,一方面加大美工的招人力度,另一方面我们开辟了一个新的思路,那就是把包含人像的视频按帧拆分,作为我们的图片素材来源。” “在此过程中,我们发现,通过对眼睛特征和嘴唇特征的综合表现,可以计算出一个人的情绪;通过眼睛和嘴唇的连续变化,可以得到一个人的情绪变化指数;通过唇形的连续变化,可以大致的知道这个人说什么话……” 正在失望之中的叶晓奇,震惊的问道:“你是说,读唇?” 霍蓓蕾拨了拨发梢,答道:“是这样的,没错,这将是我们后续的参考研发方向。” “你是说,因为相应的图片集不足,所以你们就把脑筋动在了视频上。然后,就得到了这个东西?” 霍蓓蕾点点头,“没错。” 叶晓奇却感到有些凌乱,科研树发展基本方向不应该是这样的。 图像AI技术大发展是建立在imageNet的深度学习理论的基础之上的,深度学习得到的特征库是一系列相关计算的核心,而深度学习依赖海量的图片。 所以图片不足,你们就特么去拆视频?拆视频就算了,美工不足所以你们直接就把人脸识别那套搬过来了,结果大把的资源撒下去,人景分离还是没整出来,却发现了可以做情绪识别和读唇术? 这下总算知道刚刚香取绫汇报的大笔支出花在哪了…… 真真的应了那句话:有心栽花花不开,无心插柳柳成荫 “准确率多少?” 任何图片项目都是有准确率作为标尺的,就以人脸识别来说,准确率低于50%的研究没有任何意义,商用阶段起码要拥有80%以上的准确率才行。 “情绪识别准确率高达64%,主要包括哭、笑、怒、乐、难过、伤心等词缀,目前还在进一步学习,因为分类决策比较少,所以这个学习进展非常快。唇语识别,目前仅限于普通话中文,我们主要是采用央视某套有字幕的节目进行学习的,经测试,对特定的几个主持人的口型识别准备率接近74%,而此类泛用视频的识别率……不足5%……” 74%……不足5%…… 情绪识别抛开不提,单说唇语识别。 74%什么概念,就是一句话识别正确的字数到七成,就以“人类是低等植物”这几个字来说,可能意思完全相反,但是对人类来说,猜到它的正确意思一点困难都没有。而实际错误发生的地方都是随机的,也不一定会错的这么离谱,比如“黑灰花卉会挥发”这句话,就如同正常人笔误一样。 叶晓奇不禁为那几个主持人感到默哀,估计他们要是知道他们说的话被天网研究透彻到了这个地步,以后路过中生代都会远远的绕道走。 当然只针对这几个人的研究是没有意义的,所以才有泛用的说法。 泛用识别率不足5%,听起来似乎不那么靠谱。可是事实不是这样的,万事皆有开头,只要研究大方向上没错,后续只是时间的问题。