这次的拉斯维加斯大会上,IBM 宣布今年四月将公布 Watson 的全新功能,针对于数据挖掘的新能力。主要在于提升数据关联度的训练、段落检索水平,以及搜索结果优化。
在 Watson 之前已有的基础上,进一步提高大型数据库中对于识别、理解和学习「非结构化数据」的能力。
Watson 作为 IBM 认知计算领域最核心的技术,在 2011 年 2 月美国的问答节目《Jeopardy!》上一战成名。Watson 的这次胜利被和 1996 年同样来自 IBM 的「深蓝」战胜国际象棋大师卡斯帕罗夫相提并论,同样被认为是人工智能历史上的一个里程碑。
不过随着 IBM 公司从 2016 开始正式转型成为一家认知解决方案和云平台公司,Watson 所具备的功能和价值也不能同日而语了。随着物联网的普及,每个设备都在产生数据,而这些数据带来商业价值也因为彼时的计算机识别能力而被掩盖。
同时,在像是医疗、建筑、教育、传媒……等等行业的「非结构化数据」也将在不久后迎来更大的爆发,有调查数据预测到 2020 年这些「非结构化数据」总量将超过 44ZB(440 万亿亿字节),能把这些数据挖掘整合并分析,这就是认知时代所带来的商业价值。
包括关系抽取、性格分析、情绪分析、概念扩展及权衡分析等在内这些 Watson API,作为 Watson 认知能力的积木,从 2011 来开始就在不断积累。
IBM 将认知体系的三个重要特质定义为:理解、推理、学习。通过感知和互动快速理解非结构化数据,在理解的基础上,通过假设和推理去发现数据之间的关系并分析,帮助人做出更好的决策。最后,通过实例为基础学习,从数据中分析中快速提取关键信息,持续优化决策判断。
以上,就是一个极简化的数据认知过程,通过这样的方式,让之前大量无法被利用的「非结构化数据」得以利用。
Watson 新的发掘服务,未来可能帮助到更多的行业中包括了:法律研发团队、市场营销人员、客服经理、社交媒体、论坛数据及更多内容源平台。
「到目前为止,我们探索的数据只占世界上全部数据的一小部分。沃森代表着技术与人类之间全新的合作关系,大大改变了我们发掘信息和提升决策质量的方式,速度和规模都难以置信。」IBM Watson 人工智能项目总管贝斯·史密斯(Beth Smith)指出,「借助 Watson 平台卓越的发掘功能,我们将探索数据中此前无从触及的规律、趋势及关系。」