主持人:
  在座的各位领导,各位嘉宾,大家下午好,欢迎光临人工智能时代的媒体创新与发展论坛。有人说人工智能的时代已经全面到来了,的确,16年被称为AI元年,在座从事媒体行业的肯定也切实感受到了AI在媒体行业的变化,比如已经开始利用AI进行新闻采写,新闻事实审核,新闻线索收集等等,待会儿我们的演讲嘉宾会分享更多AI的有趣应用,我也就不多说了。
  与此同时,新技术的到来也产生了新挑战,AI的到来,势必会导致媒体领域的一些行业消失,也会催生另一些新行业,我们该如何调整自身定位迎接新课题,AI会在多大程度上代替我们的工作,我们怎样与机器更好融合,让我们各自的优势最大化?还有很多问题等待回答,也有更多惊喜等待发现,今天我们也请到了知名学者专家分享他们的真知灼见。
  接下来有请清华大学新闻与传播学院教授、常务副院长陈昌凤给我们大家做分享。  [08-25 14:37]

陈昌凤:
  尊敬的各位朋友,大家下午好,非常荣幸能够参加今天盛大的会议。人工智能真的来了,非常快,本来只是在荧幕上,不在现实里,忽然间就进入了我们生活,特别是我们的媒体。刚才主持人说2016年是AI元年。人工智能给人类带来最主要的变化是哪些方面呢?
  首先当然是存储,就是存储记忆,接下来是理解,再接下来是互动,第四步就应该考虑价值观的问题,接下来就要创新。关于人工智能发展的这些步骤,我想其中非常重要的一块是价值观。
  我今天说的价值观主要是从信息价值观来谈,智能化工具时代的信息价值观。为什么说是工具理性?在座有很多是媒体才俊,我想如果在中国有一位文学家第一次获得诺贝尔文学奖之后,你会有什么反应,你会不会在你的节目,重要版面去突出,这个话题之所以这么问,我想在座的专业媒体人肯定会想的是做大量的突出,但是却出现了一个工具理性和我们的价值判断不一致的情况,这是央视一位非常知名的主持人在我们学院分享的时候说到的话。  [08-25 15:10]

陈昌凤:
  他的一档节目,除了领导人的出访,第二条安排的就是莫言获得诺贝尔文学奖的新闻,接下来还有其他新闻。收视率调查发现第一条新闻收视率很高,接下来到了莫言就降到很低,乃至于到连线的时候已经降到最低点,也是当天这档节目最低点,其他新闻节目来的时候收视率就上去了,当时他们很不理解也很惊讶。
   我记住了这个案例,我就在想这里面出了什么问题,智能科技在新闻信息分发中的判断,与专业传播价值判断有何不同,包括收视率,算法,它抓取的信息是基于用户的判断得来的,我们的专业判断是基于我们专业人、专业记者编辑去判断的,有什么不同?算法在新闻传播领域是怎么弄的,他们的原理,他们的判断是如何形成的,这种有效的科技应用,包括算法,包括我们的收视率,对信息判断和内容产生了什么样的影响,相似的新闻出现几次,你的收视率总会很低,你会不会去改变原有的判断,应收视率高的要求而重新做选择。
  同样,针对我们的新闻编辑,智能算法会不会影响到我们的创作,实际这这是显而易见的。
  第二层问题,技术理性它的商业化目标,与我们传播的目标价值是不是一致的,在这个智能算法中间它是不是意味着用户中心,如果是用户中心它是如何获取信息的,用户的需求就是合理的吗?出现了这些问题之后我们新型的媒体公司是怎么做的。今日头条用了大量人工方式去校正一些算法中间出现的问题,这是非常积极的干预,长期下来我们的智能会怎么去做?
  关于工具理性和价值理性是老问题,韦伯研究经济学最早非常明确提出了关于工具理性和价值理性的问题。简而言之,工具理性是以目的为先导,把一切符合利益,利益最大化作为它的核心追求,经济上是非常能理解的。目的合乎理性的行为,这个就是工具理性行为,而价值理性是符合我们价值判断,这些价值判断包括各种信念、宗教、孝顺、义务、尊严、美、某事的重要性等等,工具理性认为这种价值判断、价值理性其实是永远都不理性的,因为它不是以目的或者说我们的利益为最大追求,这就是出现了一些矛盾,这些矛盾在我们的智能时代也是非常显而易见的。  [08-25 15:12]

陈昌凤:
  技术理性的发展,确实是出现了使理性更加工具化的情况,在我们的经济领域和其他领域都先后出现了,这些会不会影响到我们现在的价值判断的问题,人工智能等等这些科技它是十分符合工具理性特征的载体,因为它追求效率的最大化,比如说点对点的这种传播,个性化的传播等等,它确实是带来了很好的体验。但是,工具理性它受诟病的经常是目的至上,认为你达到目的是最重要的,而忽视了一些价值的判断,所以就带来了一些问题,因此在最初级的阶段,人工智能就已经介入到了价值判断的研发里面。
  去年是美国的加州他们有一个团队开始把人的价值观嵌入到我们的机器人程序里面去,就希望把价值观或者说人类的价值判断能够介入到我们的工具理性里来。我觉得目前来说包括很多做法,包括现在一些新媒体公司,如刚才说的今日头条等等,他们都已经在做大量努力,把我们的价值理性的东西能够嵌入到工具理性这个潮流里面来。
  所以,在这种情况下我们需要做很多包括程序,包括算法,包括我们所谓干预很多方面的做法。智能应用在传媒中已经不断在兴起,四年前华盛顿邮报在报道奥巴马连任就职典礼的时候,他们用了一种智能方式,主要是达到互动的效果,而这种智能方式确实是人工多于智能的,今年纽约时报在用人工智能去展示的时候,它已经真的是非常智能了。
  比如说刚才提到的华盛顿邮报,通过社交媒体,人们在自己的头上可以嵌入自己的名字,自己的头衔,比如蓝区是贵宾,媒体用人工的方式嵌入的,我拿鼠标只要往上一点就能看到这人是谁,是什么头衔。你会在这种信息上停留比较长的时间,因为你能够看到最重要的场合里面到底是什么人。而到了纽约时报今年在做的时候,它就是完全靠智能化,靠人脸识别等等智能手段,不用再进行人工的嵌入,完全就是通过程序把这些标签全做了,而且这标签想做多少做多少,仅仅是四年时间,我们看到在新闻媒体里面用的这种智能化已经在升级,这种升级也可以看到人工智能对我们的这种影响越来越多。
  赫拉利,《人类简史》的作者,7月份到中国参加一次论坛,他讲到如果你用电子书阅读,人工智能会记下你所有的阅读行为,哪章跳过去了,哪章看得很慢,代表你喜欢。看完一本书它就记住了你是什么样的人,由此它向你推送的各种各样的信息,你要消费的东西,都是按照它的判断给你的。所以他开玩笑说,将来我们找对象的时候,可能连自己都不知道要找一个什么样的对象,但是通过人工智能化抓取,能知道我的各种各样特性,个性,能在网上匹配另外一个跟我差不多年纪的异性,各种各样的兴趣很相配,于是给你匹配上对象,他开玩笑说未来我们找对象问的可能就是人工智能了。
  人工智能确实带来很大的影响,算法推荐从1992年开始出现,在美国九十年代第一轮互联网热潮中就有一些很大的成果,这些成果在一些记载里面都说到了,其中有一些重要的推荐算法,现在算法不光是用来推荐,还用来做各种各样的工具。有多少种算法,工程师们说我们无法统计,因为几乎每一个案例都应该有自己的算法。
  但是,大的方面来说,最常用的算法可能有二十多种,在我们的新媒体里面,特别常用的像这三种,一个是基于内容的推荐,也就是你平常爱看什么,爱看体育,你点击了多少个记录,就记录下来你喜欢在这个领域里面这个信息,向你推荐,基于用户协同过滤的算法用得最广泛,据说现在最科学。我也看了一些文献发现,美国也在大量推荐这种算法,Facebook,Google他们大量是用基于用户协同过滤的算法,人跟人之间的关系计算,物和物之间关系的计算,还有一些降维方法的计算都非常有意思,最后它能够扩展我们视野,所以这种算法带来的影响会比较好,比较大。  [08-25 15:13]

陈昌凤:
  其他还有基于关联规则的推荐等等,大家也都知道关于尿布和啤酒放在一起卖的故事,都是基于关联规则的。这些算法怎么应用到我们新媒体领域,这是今日头条的媒体实验室工作原理,要抓取三方面的特征进行匹配,最后形成我们手机上所有的内容信息,比如推荐栏是你独有的,一个是用户特征,包括你的性别,年龄,使用的手机终端,很多方面,各种各样的个性,环境特征,最终形成了我们说属于你的推荐。你打开今日头条问问你左边右边的人是不是跟你推荐完一样的,几乎没有一样。有一次是在上海,我们暑期有一个传媒领袖大讲堂,学生们,来自190个大学的300多个同学,他们当场打开手机,每一个同学都订阅了今日头条,对下来以后才不知道原来你的跟我的不一样,我说你以前有没有注意到这个?没有。那就是基于算法做出来的。
  举个例子,我的大学同学,他说你看你是教授,我做生意人也是很爱学习的,每天晚上学到12点,我说你看什么书,他说我看今日头条,因为它每天给我送四五条,五六条书法类的信息,我一定要看完才睡觉,看完以后觉得很有收获,觉得自己成了书法界的专家。后来我说看一下我的推荐栏,因为我老演讲,它老给我推送你要学英语,国内国际新闻,这就是我们所不一样的地方,基于这个,大家也看到我是在南京打开的,属于环境匹配的,他是在南京,我也是在南京,但是我们的信息还是非常不一样,这是算法之后个性化带来的影响。
  Facebook的算法从2006年到现在有了很大进展,而且它保密,很多人要探秘,把它揭了很多算法秘密。去年被称作叫算法里程碑之年。第三方公司调研说,人工编辑它的影响已经小于算法编辑了,出现了50%的交节点,接下来算法编辑层层往上去了,这也是大家我们现在看到的。我们看一下比如说找工作的拉勾网,年轻人很关注,这些新媒体公司他们招的人的定位,好比说这上面有今日头条,一点资讯等等这些,爱奇艺,他们的算法编辑招的数量比人工编辑多得多,这就说明他非常重视这个领域。
  有些像网易现在还在做大量的内容,所以它会人工编辑比较多,而且亮点在最底下,大家可以看最底下起点薪酬,人工编辑是8000,算法编辑是2.5万,由此你会看到确实是到了算法编辑大热的时候,也带来了很多的需求,这些需求在某种程度上是告诉我们,我们现在比如说要培养什么人才,最近有人总结了美国新闻传媒界出现了10种新型岗位,这新型的岗位过去都没有出现过,不是过去的编辑记者的岗位,那些新型岗位最核心是围绕用户,帮用户服务的,做互动的等等这些,其中新型岗位里面我们说算法类编辑是很重要的一个方面。  [08-25 15:13]

陈昌凤:
  什么样的算法更科学有很多的研究,目前认为基于人工协同过滤的算法最科学。最核心的东西,基于算法推荐传播内容发生变革,因为算法它实际上带来了很大的变化,这是今日头条的副总马老师,他在一个演讲上讲的,实际上都变成一个向量表,用户和内容都成为一个向量表,可以看出人的情绪变化,信息的内容变化,由此带来很多方面,比如说算法对我们人去创作是什么影响,纽约时报一个案例 ,做的就是用数学算出来之后告诉编辑记者如何去创新,如何去更加提升我们的内容创作,实际上算法不只是一个推送的工具,它也成了一个内容创作的工具,这是英国的金融时报,以及英国卫报等等他们都在用算法辅助他们进行创作,这就是说算法已经不只是我们的一个点对点推送的工具,更是辅助我们创作,是生产的工具。
  在信息里面纠偏的问题,时间关系我不展开了,总的来说我们的信息偏向非常明显,有很多问题,而西方现在正在做的事情就是进行信息纠偏,比如说华尔街日报做了一个信息纠偏的工具,用它的自由派和保守派的信息来统领这种偏向,它告诉你只要你看一个新闻信息有偏向,它就可以向你推荐倾向性的新闻内容,因为这个偏向对我们人类产生太大的影响。如果没有包容性是很可怕的,包容心会告诉你我们实际应该了解一下另一边的信息,包括体育智能公司也在做,这种你看到的新闻是偏自由还是偏保守的,它会告诉你并且会给你提示,我给你一个好的提示告诉你,你看得太保守了,有一个同样的内容但是是偏自由的观点,你要不要去看一下,实际上纠偏的事情他们进行编码,最后做了很多事情。
  总之,现在智能带来了特别大的影响,人工智能不仅给我们的推送带来了有效性,带来我们客户喜爱的信息,对我们信息的生产分发也带来了特别大的影响,所以价值观在其中有特别重要的作用,这时候如何去协调专业性的价值观和我们智能化的理性,这是我们未来智能化发展需要考虑的重要问题,谢谢各位,谢谢!  [08-25 15:14]

主持人:
  下面有请光明网总裁、总编辑杨谷发言。  [08-25 15:14]

杨谷:
  各位专家,各位网络媒体的同行,大家下午好,很高兴有这个机会跟大家分享一些不太成熟的关于人工智能的想法,人工智能像刚才陈昌凤院长所说的,从去年成为一个全民所熟知的热词以后,现在可以说已经席卷了全球。从大概六七十年以前,从人工智能这样的一个概念诞生到现在,能有今天这么火爆的一个热度,可以说是我们所从事互联网或者是从事计算机领域的从业者非常欣慰的。
  人类发明蒸汽机,我们是期待获得更多的力量来解放我们自己的肌肉和骨骼,人类发明飞机是希望能够像小鸟一样的自由飞翔,让我们享受天空的自由。二十世纪里边最重要的发明,计算机,人类是希望有一个机器能够来代替自己的思考,使人的大脑能够获得解放和自由,机器代替人的思考,它终极的追求就是人工智能,大家如果看过一个美国的电影,叫《模拟游戏》,那个电影讲的就是人工智能概念的提出者和奠基者,英国的科学家图灵的故事,图灵在二十世纪四十年代提出人工智能这个概念以后,到了现在差不多六七十年的时间。我们中国引进人工智能的概念大概是在八十年代的时候,刚刚改革开放,那个时候有一批科学家他们到美国回来了以后,把人工智能这样的信息带了回来,其中一个很牛的人叫做渠川璐,他创建了人工智能学会,当时就担任世界人工智能学会的副会长,这个职位也是中国人在人工智能这个领域里边,所担任的学术职位到目前为止最高的,在大学里边我就遇到了这个人,除了这个人以外还有其他牛人,给我们这些学计算机的带来巨大的震撼,他们这波人开创了中国改革开放以后人工智能的研究。  [08-25 16:01]

杨谷:
  在他们的带动下,中国的人工智能还是有比较高的一个起点,因为他们都能够担任国际组织副主席这样的位置,他们所奠定的基础在机器学习的领域里面,当时也预测人工智能估计会在二十世纪末期就能够运用起来,我们也为之振奋,刚才说了计算机就是为了解放人的大脑,代替人的思考,人工智能就是它最终极的追求。
  现在看,这个预测早了一点,在2014年,全世界才第一次有一个人工智能系统通过了图灵机的验证,意思是它大概能够模拟出3岁小孩的智能,3岁小孩判断事物是怎么判断的,机器能够模拟出来。如果说这个机器系统它所做的判断跟3岁的小孩差不多,我们就认为这个机器具备了差不多3岁小孩的智能,这是2014年巨大的突破。
  后面像AlphaGo这样可以说是划时代的产品,象棋比起围棋简单很多,围棋361点,可以产生出361个阶层这样的可能性,即便以今天的计算能力似乎也是不可逾越的天文数字,Google的人工智能专家用一系列的技术解决了这个问题,打败了李世石他们,今年把柯洁也打败了,现在可以说全世界,当然也包括中国人,没有人说不服人工智能的。
  人工智能是不是已经非常厉害了?实际上也还不是很厉害,也还有很多可待发展的空间。从八十年代中国改革开放以后第一辈的科学家,他们开始来做人工智能,到今天各个公司也都在做人工智能这方面的尝试,刚才陈教授介绍的是今日头条方面的探索,我们也都知道像百度它也在做,无人驾驶这一块,腾讯、阿里也都在做。  [08-25 16:03]

杨谷:
  今天的人工智能跟过去相比,在三个方面取得了比较大的突破,二十世纪的时候,那些老一辈的计算机科学家,很多运算问题他们都解决了,但是有三个问题他们解决不了。
  第一个是没有海量的数据。那个时候所谓的海量数据就是几个G的数据,今天我们在座也都知道,我们自己的硬盘都是几个T,几千倍于当时海量数据,各大互联网公司的数据中心里面运行的数据应该是几千倍几万倍这样的数据规模,这是大数据,过去没有,现在有。
  第二个是没有海量计算。在那个时候的计算机计算能力很差,今天我们通过云计算已经解决了大规模的并发计算这方面的问题。
  还有一个很大的变化就是互联网的出现,因为人工智能它依赖于鲜活的数据输入,如果说我们没有一个鲜活数据输入,都是一些死的数据,这个系统会非常难用,用户体验不会好,它的可用性会很差,现在有了互联网,几乎每一个传感器都可以当作你的人工智能系统输入语言。同时,互联网还极大改善了人工智能的可用性,也就是说人工智能模拟出来的结果,能够通过互联网随时传达到我们每一个用户的手机里头。
  这三个方面巨大的突破,互联网,海量计算和海量数据,我认为是使得人工智能能够快速转向应用的重要原因。  [08-25 16:05]

杨谷:
  涉及我们新闻媒体行业,我们只是人工智能应用的一个领域,我们能做点什么样的工作呢,刚才陈教授也介绍了一下,我们也在想。我们做了一些机器写作,我们也在尝试跟今日头条,微软的搜索引擎,微软研究院在做类似的合作,除了这一块以外,我们尝试着做一个跟我们在座的新闻同行都有关的一件事情,我们采访中经常会遇到的认人的问题,我本人是比较眼盲,人一多我就认不清楚谁是谁了,可能很多我们的同行有一样的毛病,尽管你很想认出你采访对象,陈教授举的例子是美国的,把美国的议员认出来,参众两院加一起500人多一点,有一些博闻强记的记者认得出来,那些人老在电视上晃,咱们的两会代表委员就不太好认,两会代表委员,加一起差不多5000,很多老总自身上过两会做报道,会发现大多数人很难认,现在包括央视等咱们的同行都是发明了一个很严谨的工作程序,采访了这个人以后,赶快把身份证牌拍下来,哪个单位的,后面做报道才不会搞错,即便他自己采访这个人他自己也可能不会记得住。
  我们经常在两会现场遇到采访了半天,然后问您是谁这样的情况,我自己也是看半天,经常认不出来围着的人是谁,我们就在想现在人工智能图像识别,人脸识别已经做得不错了,所以就在这个功能上做一些尝试。  [08-25 16:06]

杨谷:
  这是我们今年两会期间的产品,小明AI两会,我们把能够收集到的代表委员信息放到库里面来做一个标签,把他的名字标上,这个要人工来做,机器做不太放心,怕识别错了,然后我们把历年来,这一届里面,比如说这一届会议差不多是四年,所有的两会的报道,有不到50万篇,这些都输进来,做了刚才陈教授所说的关联关系,把这些人脸,这些人的照片跟他们相关的报道关联,然后再做一个数据库,到全国人大或者全国政协的网站把这些代表委员他们的个人介绍,把这个数据库下载下来,这是一个表,把它放在一起。
  最后我们要用一个技术,这就是我们跟其他公司来合作,把图像识别,人脸识别的技术用起来,这次我们用的是微软的技术。当我看到一个代表,然而我不认识他的时候,我拿手机拍一下,拍进来以后系统大致就识别出来了这个人是谁。
  比如我们找了雷军的照片,我们就是拿我们的手机来扫了一下,扫了以后机器会在里面找。如果说要让我把13亿人都输进去,估计现在机器还识别不出来,一会我再讲人工智能的局限,现在人工智能还是会有很多局限性。但是,识别这几千个代表委员还是可以的,它就会找出来跟雷军的面部比较匹配的,有了第一步成功的识别,后面我们要做的工作就好做了。
   产品简单用了一些比较成熟的技术,跟人工智能沾一点边,严格意义上,人工智能六度分割理论被用到里面来。系统还会吧跟雷军相关的代表委员找出来,这些人可能都出现在同样的报道或者同样的相关的文章里面,相关文章我用六度空间把它距离拉近,这些代表委员和雷军是相关的。从40多万篇,50多万篇的稿子里面找出来,雷军他所关注的领域是哪些,关注中国制造,扶贫,慈善法,如果我不认识雷军,我看到了眼前的这个代表委员,我就用我的手机拍了以后,大致就知道他感兴趣的这些话题,作为记者提问的时候问这些就好了,应该是他感兴趣的,如果一个代表委员问跟他毫不相关的问题大家都很尴尬,浪费时间。  [08-25 16:08]

杨谷:
  我们今年在两会期间推出来的这个产品,引起了很多的关注。我们把人工智能领域的技术加了进来,刚才讲的都是我们的用户在默默操作,跟人机交互方面还没有怎么做,我们就把语音合成的技术加进去了,我们用的是技术是科大迅飞的技术,科大迅速在语音识别方面,我想了解哪个话题或者哪个委员代表的信息,我直接在上面说就行了,可以输入自然语言,以后大家有兴趣可以做一些尝试。
  这个代表委员他的年龄,简历,可以用嘴说出来,在我们这个客户端里面都能够展示出来。还有语音合成,既然能够显示出来了,有时候可能记者或者是使用的人他会不愿意用眼睛看,而是用听,我们加一个语音合成的功能进去,直接把声音读出来,周围的环境允许就把它读出来。这样就形成了一个对我们记者采访两会还比较有帮助的这么一个叫小明AI两会人工智能的系统,我们做了一个实验,引起了相关部门的注意,还专门写了一个新闻做介绍,这是人工智能就在我们新闻报道行业里面一个小的应用。
  大家推而广之想一想,它对记者有用,对于普通的网友有没有用呢,可能还是有点用,平时如果说网友他在看一些报道或者看一些电视的时候,他对其中某些代表委员感兴趣,但是记者没有提供这方面的信息给他,这时候你可以拿出自己的客户端来扫一扫,来把图像拍进去,你就具备了那个记者同样的能力,可以了解你所想了解的代表委员他们所关注的话题,跟他有关系的人物,以及他当时在做什么,这是利用人工智能现在已经在做的一件事情。  [08-25 16:10]

杨谷:
  因为我们刚开始尝试,还有很多要改进的地方。后续我们就在5月份一带一路高峰论坛里面把这个技术延用了,一带一路会的时候,脸盲的任务问题更严峻了,很多老外没来过中国,你想认也认不出来,如果是人家不说英文也不说中文,你甚至都没法去问人家。这个时候拿这个系统去扫扫人,看他是不是咱们想采访的,想采访的认出来的就去采访,否则别浪费时间,在一带一路的时候我们的采访报道也用上了。
  这两天我们就以这些为基础申报了北京市媒体融合的重点实验室,我们的人工智能新闻信息服务的实验室也入选了,也欢迎在座的同行们跟我们一起进行探索,这个方面看它还能够做一些什么。
  刚才讲的是已经做的,最近做的是把语音合成这方面的技术进一步用起来,把它用来读我们的报道和报纸,报道这方面,会跟一些场景匹配,目前产品还正在研发当中。上午也有几个媒体同行跟我聊,来采访我,说AI写稿方面的前景怎么样,这方面我也想就我们自己的一些探索聊一些自己的感受。
  刚才讲的是AlphaGo的情况,在国外权威的专家来判断,AlphaGo它大致相当于人类婴儿4岁的这种智商,注意,我只是用了智商,没有用智力,意识这样的词,也就是说智商而已。可想而知,如果一个4岁的小孩,如果说让他写文章给我们在座的看,我相信我们在座的人没有人会看,可能一个正常人也不会愿意看一个4岁小孩写出的文章,所以AlphaGo它虽然能够打败科技,但是如果用它来写文章,显然抢不了我们在座任何一个人的饭碗,因为没有人愿意去读这样的文章。  [08-25 16:11]

杨谷:
  所以,我们尽管去尝试机器写作这一块,但是我们也觉得大家尽可放宽心,以目前的发展速度来讲,不会抢我们的饭碗。目前我们所用的人工智能这些技术,或者说理论,基本还都是过去30多年来所奠定的,刚才我讲到的孙怀民,渠川璐老一辈的计算机科学家他们所奠定的基础,目前来看还看不出来在这个方面有一个巨大突破口。
  在他们两人之后,现在整个中国或者是华人这个领域里面,人工智能方面最牛的大概有两个人,一个刚刚跳槽的百度的吴恩达,前一任谷歌首席科学家,现在还拥有整个美国高科技界第一美女做夫人,他们夫妇俩都是人工智能的科学家,还有一个是上午时候胡校长演讲里面所提到的一个人叫杨强,也变成了美籍华人,现在人在香港,是华为实验室的首席科学家,这些人都是计算机科学方面的专家,人工智能领域里面的主流观点,人工智能的突破不仅仅是考虑计算机科学的进步,计算机科学只能做一些形式逻辑的推理,但是计算机科学解决不了人的认识和人的意识问题。
  现在其实生物医学,生物学,化学,物理学都在不同领域里面对人的意识机制,人脑运行的机制进行研究,取得了很多的突破。化学,物理学,生物学,医学都在取得进步。但是,这些成果都还没有运用到我们今天的人工智能这个领域里边来,也就是说到今天为止人工智能还像是一个黑箱子,我们设定一个目标,计算机你要去做什么事情,我们输进去了一堆数据,最后出来了一个我们认为可用的结果,但是这黑箱子里边是怎么来运行的,为什么我们得到这个结果它就能模拟人的意识呢,我们现在说不出来。人类到现在为止我们连自己的意识到底是一种什么样的机制还不了解,一个人到底为什么活着,这个人死了,人死了有没有意识,意识到哪去了,意识产生的机制是什么,现在我们还一无所知,可以用一无所知这样的词来描述。  [08-25 16:13]

杨谷:
  我们今天所做的工作,也就是说只是在推理逻辑方面,AlphaGo做到了4岁小孩水平,并不是说它有4岁小孩的喜怒哀乐,它是没有人的情感,也没有人的意识的机器。所以,AlphaGo要想成长到像刚才我里边提出来的问题,什么时候能够成长由4岁变到14岁,我觉得光靠吴恩达,杨强这样的科学家,这样的计算机科学家恐怕不够,还需要化学家去研究,我们意识形成的时候到底发生了哪些化学变化,需要神经医学家去发现。我们在形成一个意识的时候到底是有哪些神经的触碰,需要物理学家进行原子以下的微粒分析,甚至还需要心理学家来研究人的心理形成的机制,这些都还是空白点。
  所以,我做一个结语,今天人工智能已经取得了非常大的进展,我相信既然说4岁这个智商的AlphaGo已经能够打败科学,我相信像美国现在整个做的实验,去打败长途汽车司机完全是可能的,美国已经成功了,因为没有一个司机能够连续开两天两夜不睡觉,但是人工智能所指挥那个自动驾驶别说开两天,连开20天,两个月也没有问题,所以我们生活当中会有一些领域会有一些职业被人工智能所打败。
  但是,并不代表说人工智能已经能够由4岁突破到14岁,而是它是4岁的智商打败人类,现在可以说能够代替人的工作的问题。
  回到我们所从事的新闻行当,我相信可能也会有一些工作,如果是重复性的工作也能被4岁智商AlphaGo来代替,但是对于我们这么一个热爱文字,热爱方块字,热爱文学的这么一个民族来讲,想要代替我们去写诗,去写对联,去写那些激扬的文字,写马克思主义政论,我相信现在的AlphaGo还没有这样的情感,还没有这样的推理,也没有这样的意识能力。
  我的一些思考就介绍到这,谢谢大家。  [08-25 16:15]

主持人:
  接下来发言的嘉宾是天津海纳媒体大数据科技发展有限公司CEO张毅,有请。  [08-25 16:15]

张毅:
  刚才两位嘉宾讲了很多前沿的东西。跟各位今天参会的媒体用户首先做一下自我介绍,我是海纳公司的张毅,很高兴跟各位嘉宾汇报一下海纳公司的进展。2007年,海纳新闻转载服务系统开始提供服务给媒体客户,已经为媒体客户至今服务十年之久,今天参会的很多嘉宾已经是我们多年的老客户。
  海纳之所以能够获得众多的媒体客户认可,这是基于海纳为用户创造真正的价值,海纳产品的设计和打造都是围绕以下三个理念展开的:小切口进入,解决实际问题,注重应用场景。海纳的技术能够帮助我们的用户解决三个方面的困惑:现代传播力如何评估,如何保证信息安全避免事故,新技术如何构建竞争优势。  [08-25 16:20]

张毅:
  首先谈谈我们的传播力部分。一个跟大家都有关的案例,本次大会从8月7日传播开始到今天下午,我们宣传系统统计有52篇报道,第十七届中国网络媒体论坛即将召开的报道传播最广,已有88家转发,74家媒体转载。这个传播中出现了两次高峰期,第一次是8月16日,第二次是8月23日。基于网站传播和转载传播力的工具,可以帮助媒体清楚知道自己的稿件如何在网络上被传播,自己的稿件通过哪些渠道与公众见面。好的产品也会创造一些新的场景,如下面三个场景,一个是可对原创稿件进行追踪,二是对主创人员进行绩效考评,三是稿件撰写。我们还要了解什么样的用户对我们的报道感兴趣,他们对报道是什么态度,有什么反馈。8月22日的时候,印度近百万员工举行大罢工,抗议政府出台有关银行改革制度,我们跟7家重点媒体进行了监测,发现了23篇评论新闻,687条内容,4万多人参加了评论。我们对今日头条和网易新闻APP评论进行了分析,发现一些有意思的信息,今日头条里面点赞多的都是和战争有关,网易新闻读者对国有银行的罢工大为惊诧,认为这是威胁社会安全,应该抓起来。今日头条和网易新闻是两个不同的群体,我们可以做精准投放,这是我们的传播力部分。
  我们再谈一谈关于技术构建竞争优势。技术除了避免错误,最重要在于架构媒体的核心竞争优势,海纳对于国内媒体调研,第一时间发现新闻发表,海纳的产品能够满足媒体在这方面的需求。前不久九寨沟发生了地震,我们的风信子发出了提醒地震信息,因为我们系统关注到一个微博公众号地震发生后十几秒就发出了地震信息,这个微博帐号叫做成都高新减灾研究所,主要功能就是根据地震波提前几十秒发布预警系统,为人们逃生争取时间,所以它的信息传播很快。  [08-25 16:22]

张毅:
  我们风信子的监测对象包括了上面的这些微博,资讯,新闻,这些捕获新闻信息的手段快于传统手段,拆成26中类,186个小类,我们相信是北京应急办的两倍多,我们还在不断细分,把所有事件都打上标签,及时去识别获取。这样我们对事件可以做到早发现早告知,为客户第一时间捕捉信息。
  现在我们也知道各大媒体都在做“中央厨房”,我们海纳也在里面做相应的投入,建大数据分析模块,通过分析全网的数据发现哪些是热点,哪些新闻需要重点报道,提高新闻报道的效率。这个模块是利用我们以往开发产品的能力,根据客户的需求进行开发,我们从去年8月份开始打造到今天为止刚好一年,其中有6个模块已经开始推广到市场,我们从具体的场景打进去,这样可以帮助客户解决眼前现实的问题,然后一步步解决更多的问题,我的汇报到此结束,海纳会不断提供更好的服务给我们的媒体,谢谢大家。  [08-25 16:23]

主持人:
  接下来有请拓尔思新闻出版事业部总经理林松涛。  [08-25 16:35]

林松涛:
  各位领导,各位老师,大家下午好,今天很荣幸能有这个机会代表拓尔思向大家汇报一下在人工智能的主题下,我们如何利用技术变革来驱动媒体的传播服务。
  今天上午我们胡校长,还有刚才下午陈院长都说到了一个词,变革,现在媒体是在变革,技术也在变革,我们从传统新闻采编,向大数据,向人工智能的变革,这两个变革如何能够更好结合在一起,我向各位领导做一个汇报。
  首先说内容的变革,不管是新闻网站,传统媒体,还是新媒体,内容不再仅仅是文字,图片、音频、视频、新闻可视化和机器写作,都已经变成了我们今天内容的一种新的形态,内容已经不再是过去的内容。内容的形式也发生了很大的变化,新媒体情况下我们在可视化有两个层面,一个是信息可视化,二是把更复杂的繁冗的数字,能够以数据解读的方式呈现,我们叫数据可视化,这已经成为了国内的共识,国内有很多技术公司也在这个方面进行探索。  [08-25 16:36]

林松涛:
  拓尔思在这几年也做了很多的事情,比如说去年两会我们和中央电视台合作,中央电视台根据我们的大数据展示进行选题,我们大数据中心为他们提供选题报道,编导把它做成3D动画显示,最后在央视新闻联播和晚间新闻播出。
  变革,两者相结合在一块的变革,过去我们不单是做CMS系统,还做各个生产系统,它解决的都是我们流程的发展,如何保障不出问题,如何保障我们网站正常发布,今天我们要让我们的内容变得更有价值,涉及内容的策、采、编、发各环节,首先在选题方面哪些东西该是我们应该去报道的,哪些东西不该是我们去报道的,哪些是报道出去以后老百姓关注的,过去靠我们领导的经验,现在我们要靠数据,用数据为决策提供更多的依据。所以说如何筛选过窄信息中资源的价值点,这是选题里面第一点。
  第二,我们知道该报道什么,怎么去报道,怎么报道好,如何去做策划,我们去哪里找相关的资源,背景,以前我们历史曾经报道过的比较好的内容,可以拿过来提炼支撑我这次的报道内容。我们找到了要报道的内容,怎么去报道,肯定还会去找相关的政策,图片,资料,通过今天的技术系统,能不能说出我想要的内容,它能够很快把我想要的素材推给我,机器帮我做初筛,然后我选出精选的内容。  [08-25 16:45]

林松涛:
  我们如何能够量化我们的传播,过去说报道好不好,更多是网站依托于友盟百度统计看阅读量,阅读量不代表所有,不能代表用户数量,不能代表传播趋势,怎么办?我们要用大数据,提供更多数据支撑,最后有了阅读,我们还要把这个阅读的用户沉淀下来,让用户和内容之间产生关联。 这样从选题到策划到采编,传播,经营,这五个点,都不是我们过去任何一个环节能做的,也不是我们采编系统,发布系统能做,它就是大数据和人工智能提供数据的支撑。
  今天大家说到了很多人工智能,实际人工智能带有两个方面,一个叫机器感知,一个叫机器认知,我们的语音识别,图片识别,这是机器感知。机器认知是机器通过一些规律,像人的大脑一样了解这些内容。我们拓尔思公司这十多年以来,一直专注做中文的自然语言处理,和国外语言处理是不一样的,很多人看到很多投资报告,人工智能可以用在很多行业,很多时候说人工智能用在媒体行业,投资报告里面,甚至我们认为,虽然他们没有提,人工智能在媒体行业是有天然结合的优势,我们每天面对的是文字和知识,人工智能自然语言的处理、知识自动化能够优先应用在我们的内容生产。
  我们的编辑系统今天都是知识生产,知识服务,我了解到,国外的一些研究院,大学,大公司的研究所,现在在做这样一件事情,我们做很多的机器人写作,国外机构他们在研判,说人的创造力在短期内机器是没有办法解决的,怎么办?过去我们记者很多工作专注于渠道,如何在网站上把这个文章写好,公众号,我们的编辑记者从新闻学院学习到的,更核心的是内容为王,新京报每年拿3000多万版权收入,为什么它能做到别人做不到,新京报有更多的精品原创,技术应该让我们的编辑记者从日常的渠道烦琐重复的工作中解脱出来,专注于生产出原创的精品文章,技术辅助帮助你的文章做分发,分发传播得更好,这是技术和我们编辑媒体结合方面,目前我认为最有价值的一点。  [08-25 16:48]

林松涛:
  只有到我们数据完善形态情况下,比如说通过大数据选题策划,它才能提升我们内容真正的价值,未来终极形态现在还没有到来,以后会发展什么样现在也不好预测。因此,拓尔思从2000年开始做中文知识处理,到今年已经17个年头了,这17个年头里面我们发现,自从2015,2016年深度学习让人工智能上了一个新的台阶以后,我们也在积极探索。特别像我们文本自动分类,标签提取,情感分析等等,很多的环节通过深度学习,人工智能的方式,准确度至少提高10%-20%,我们推出了基于深度学习的,算法模型是拓尔思用到的核心算法,机器认知和机器感知,拓尔思都把握了相关的技术和方向,我们也研究出了相关的核心产品,为媒体生产前,生产中,生产后提供了相应的服务。
  为什么生产前,生产中,生产后这些服务我们都看得比较眼熟,这是我们目前经常用到的关键点,我们看到右边有一个叫深度学习的应用,很多媒体一说到大数据,人工智能,都会说好像大数据和媒体结合就是舆情,选题研判,我认为这是一个偏见,或者走得比较偏,因为大数据和人工智能在媒体上可以结合的点非常多,我们现在都用文字做传播,记者拍的照片在网上广泛传播,能不能用深度学习的方式找出来,我们有图片的学习功能,基于深度学习的图像检索,能够很快知道哪些图片是你生产的被别人使用了,传播趋势研判,我能够知道哪些稿件发送以后传播效果更好,我们和浙江日报报业集团在探索的实验室项目,历史上同类事件,通过研究它的传播规律,每一次写新的文章我会给他一个新的线索,哪个角度你会得到更好的传播效果。
  甚至还有团队组建上,其实我们的编辑记者自己也是有不同的能力图谱,给我们的编辑记者做完画像,我们要开一个重要的会议,派很多记者去,以前很多时候,比如说杭州G20采用报名的方式,哪些记者哪些文章传播力最好,哪些记者和哪些领导的关系比较好,推荐参考。稿件分发辅助,我一个稿子写完以后,大家都有新媒体,网站也会有很多频道,这个稿子放在哪里比较好,这类频道,APP,或者这些微信公众号里面传播比较好,我们要跟媒体进行画像,通过媒体,时效性等等角度把稿件进行分发辅助。
  拓尔思也推出了基于大数据的开放平台,这个开放平台里面我认为我们的平台里面是6+1个平台,策,采,编,发,评,营,屏,在这里面我们强调数据化,个性化以及智能化,这是媒体资源的融合平台,以前我们的一个升级版,通过人工智能的方式把以前资源共享变成了知识库。融合生产创作平台,我们在日常生产里面可以看到,记者实时写稿子,相关报道主题,或者互联网上相关类似主题别人怎么写的,我能给你推荐出来,点击稿件背景的时候不用记者做任何的操作,能够自动进行识别人名,地名,机构名,关键词,让记者通过点击这些相关的词能够找到相应的背景。  [08-25 16:49]

林松涛:
  最右侧是今年全国两会的时候我们给新华社做的新闻报道分析,不仅仅是文章的专题,我们是采用数十个角度,把两会的报道进行分析,媒体的舆论引导能力,议题设置能力,这两个议题我们一般很难进行量化,我们在新华社各个系统里面把所有里面实时热点拎出来,跟新华社每天自己发的稿子结合,我们知道哪些热点是新华社引导的,带这个标的,今天有十个热点,媒体你就引导了四个,这个议题热点可能不是你引爆的,可能是人民日报,但是新华社有没有跟进,有没有去发声,议题设置,跟真正媒体结合在一起,我们把大数据走到媒体应用当中去。
  每一个热点点击了以后,它有各种各样的角度分析,包括热点的衰落期,这个热点里面有没有什么领导做过什么批示,讲话,什么观点我不用人来做,全部可以自动提取出来。
  传播分析这一块,很多公司都会做,我也不多说了,把文字,转载情况,阅读情况,互动情况,拟定模型生成一个指标。报道指挥,以及我们在做网站的时候做分析,我们推出的功能全面超过了百度分析,分析网站,APP,微信公众号,对网站运营这是非常好的秘籍。
  很多媒体在做大屏,非常炫,非常酷,往往都是给领导看的,或者给外面参观的人来看的,你知道重点,知道怎么看,我们和媒体实行深度合作的时候,大屏每天24小时合作的时候,从炫酷大屏,转为这个,外面来参观的时候我炫酷,内部使用简洁的版面,编辑们24小时使用,日常工作,每个稿子每天发布的情况。智能画像我们也在和中国新闻网在合作,帮助他们应用在APP工作中,也拿这个APP做出千人千面的推荐模式。
  从2014年习总书记提出媒体融合以后,我们已经和14家中央重点新闻单位合作,拓尔思有1000台服务器,当时建数据中心是对舆情服务的,媒体和舆情运用的角度是完全不一样的,我们把所有的基础数据,媒体有特色的数据进行了详细的标语,数据不要求多,数据不在于多和全,在于数据提供的价值。  [08-25 16:50]

林松涛:
  高精准,高时效,我的微信数据可以实时推送,误差不超过一两分钟,还有包括结构化以及场景化,这里一切都是为场景化来服务。
  做了这么多媒体大项目的感触,很多媒体都在说大数据,我参加很多会,张口闭口就是大数据,大数据在媒体里面真的应用得很好吗?
  我们的生产模式,从过去的策采编发是很完整的生产链,上面没有大数据应用的环节,拍脑袋就决定了,到今天这个事应该怎么做,头条放什么,大数据会给它提供支撑。发稿也是经验决策,没有大数据应用,传统的生产模式不变,大数据只是锦上添花,不能起到真正支撑作用。
  数据的精准性是技术能不能运用在一起,最近有一家做数据很火的公司,一个友商,他们和我们给某办提供大屏使用的时候,一带一路的展示,什么词条最好,第一个词是“一带”,第四个词是“一路”,把一带一路分成两个词,数据怎么要保证准确,这一点我觉得还是大数据媒体真正能够运用起来是很重要的,不仅仅是炫,我的介绍就是这些,谢谢各位。  [08-25 16:52]

主持人:
  非常感谢分享,刚才听各位嘉宾分享的过程当中,我也在思考一个问题,人和机器区别究竟在哪呢,机器能够运算非常多的数据,甚至速度比我们快非常多倍,但是却对常识性的东西却束手无策。技术发展过程中,人类对技术利用的过程中,总是会伴有一点点担心,但我想也许就像赫拉利说的那句话,“正是人类的智慧让我们成为了这个地球的统治者”,人机共生的时代我们也会因为我们的思考,我们的创造力,我们的爱,我们的感性,甚至是我们的缺陷,是让我们之所以成为人类的原因吧。
  我们的发言环节到此告一段落,10分钟茶歇之后我们将进入对话环节,谢谢。  [08-25 16:53]

主持人:
  各位嘉宾,各位同行,各位朋友,我们论坛的互动话题现在开始。
  非常高兴担任今天分论坛话题一的主持人,我是人民网副总编辑孙海峰,上午听取了各位领导和专家演讲之后,我对有一点判断非常认同,传媒大学胡校长演讲中提到网络媒体经历了1.0内容媒体阶段,2.0社交媒体阶段,现在跨入了3.0智慧媒体阶段,对于我们媒体内容的生产也发生了巨大的冲击和影响。
  每一次新技术的出现都会对媒体行业产生巨大的变革和影响,我记得在我们互联网技术诞生之后,特别是网络媒体的出现对传统媒体人产生了巨大冲击,很多传统媒体人有一种深深的焦虑感,担心自己的行业要被替代。仅仅在十几年过去之后,现在轮到我们做网络媒体的人开始有焦虑感,是不是新技术的诞生,人工智能的诞生又会让我们的网络媒体成为旧的媒体,而产生更加新的新兴媒体。
  今天下午这个环节我们重点按照大会的安排来讨论人工智能时代的媒体创新与发展,在这个环节我们请到了四位嘉宾,他们是:中国青年网总裁、总编辑郝向宏,白云山科技有限公司联合创始人兼首席技术官童剑,视觉中国高级副总裁王刚,今日头条媒体合作与发展总经理安娜。我们共同探讨人工智能对我们新媒体的内容生产和商业模式会有怎样的创新,在直播短视频等各种新技术之后,下一个风靡网络的技术手段又会是哪些?
  人工智能带动了我们媒体方面的内容生产,包括通过更智能的分发,使得我们的网络媒体和我们的网络受众结合得更加紧密,下一步怎么能够用更好的人工智能的技术,使我们的网络媒体更好的给用户提供良好的阅读体验,这一块郝总有什么体验可以给我们大家分享?  [08-25 17:12]

郝向宏:
  我们这个论坛讨论了很多人工智能,新媒体,新的挑战,但是我想从另一个角度提四个问题,如果能把这四个问题回答了,说明人工智能和新媒体之间它的互动还有很大的空间,还有更多的努力需要我们搞技术的同仁去完成。
  第一个问题,人工智能都是基于一种算法,基于一种大数据,在汽车发明以前福特曾经跟他的市场部门部署调查,说你们调查一下市场大家需要什么样的车,最后市场部门说我们调查了很多人,大家需求是一辆走得更加平稳比较安全的马车,福特说不对,我要的是对马车进行颠覆的一辆汽车。我们大数据,如何依托新媒体传播最能够推动人类实现自身价值的那个点,这个问题如何解答,需要我们通过大数据进行分析。
  第二个问题,章莹颖的失踪,按理说美国的大数据,它的摄像头精准程度,摄像头摄到的人像,和照片的匹配程度是全球最高的,大数据没有比美国更强更精准的,但是为什么找不到章莹颖,我们大数据在这里发挥什么作用?
  第三个问题,不久前国家四部委发出通知,严厉打击吸引大学生传销行为,但是我们的记者去天津静海去现场看大学生传销那条沟,最后发现就在沟的两边,就在道路上有很多摄像头,这个摄像头识别跟公安系统都是联系非常紧密的,传销人员实际上他并不使用这些能够被监控到的网络或者说数据点,他用的都是形体语言,纸条传输,变成了鸡毛信,让打击传销行为变得分外困难。面对这样的现实,我们的人工智能如何找到自己的用武之地?
  第四个问题,在去年包括2015年,中国青年网对侮辱英雄邱少云的行为进行了连续报道,在报道初期如果根据大数据分析,在我们抨击加多宝公司的微博下面,99%是对这项行为表示谩骂和不认可的这种评论,由于这家公司跟很多媒体也有合作的关系,所以更多的媒体也不发声,如果根据大数据统计,捍卫英雄的行动必败无疑,但是经过两年的持续报道,也有更多的媒体最后都参与进来,在今年的两会期间,全国人民代表大会常务委员会通过了民法总则,增加了第185条,明确规定,损害英雄烈士的姓名,肖像,荣誉,名誉,损害社会利益的,应当承担民事责任。而法律做出了这条修改,跟刚开始大数据汹涌之间完全不是正比例关系,恰恰是反比例关系,面对这样的结果我们的大数据和人工智能如何得出和法律相一致的结论?
  我想要回答这些问题,恰恰是我们大数据和人工智能,和网络媒体之间应该说在价值观引领上重要的契合点,我就先抛砖引玉说这几点。  [08-25 17:15]

主持人:
  谢谢郝总刚才提出的几个问题,人工智能这几年特别火,但是并不是一个最新的概念,对人工智能的研究已经有几十年历史了,最近这些年随着超大规模计算能力的提升,特别是云技术的出现,使得人工智能的快速发展提到了我们面前,有人提出了云是人工智能的强载体,我们今天就有云科技的创始人,白山云科技童总,请结合您所在的云科技角度来给我们介绍一下。  [08-25 17:18]

童剑:
  最近几年技术发展迅猛,确实说大数据发展是很大的一个推动,计算能力的提升,人工智能的技术发展将近三十年了,现在的算法应该说几十年前就已经形成,或者说九十年代当时是火过一次人工智能,但是没有火起来,随着移动互联网的发展,机器学习的大数据有了,2010年之后,超强的计算能力具备之后,再一次点燃了人工智能的热潮,现在准确来说,云计算本身其实对人工智能还没有直接的推动,但是它确实是一个基础的设施,因为有了这样基础设施,不管是人工智能还是企业去做数字化转型,提升它们的IT能力,其实效率都提升了,但是最主要还是从人工智能本身所依赖的计算能力和数据,现在来说取得了很大的提升,而且随着最近这些年像国外的大型科技公司开创出来一些很好的神经网络算法,而且还有这些深度学习框架,这些其实也是很大程度上降低了使用人工智能的门槛。
  之前我们往往都认为说像人工智能这么高大上的技术,它要么是在顶尖的大学,或者是在科研机构,要么就是在那些科技公司,巨头科技公司的实验室里头,可能普通的公司很难去应用这个技术。但是,随着这些开源的人工智能框架,这些技术,它能够被更多的公司拿去使用之后,再加上花钱可以买来的计算能力,所以说很多公司自己都可以构建自己的人工智能平台。  [08-25 17:20]

童剑:
  目前这几年,我们很多企业已经很容易去使用人工智能这些技术了,虽然已经取得了很好的现状,但是并不代表说人工智能现在就已经有很好的应用了,离一个很好的应用还差很大的距离,比如说像人脸识别技术在安防领域,金融领域有很好的应用,通过长期的数据积累和训练,人工智能,人脸识别能够做到超出人类识别,准确度达到98%,人工智能已经高于人类的能力;医疗领域已经做到有一些病理识别上,人工智能超出专家水平的识别能力。所以在一些行业应用上现在有一些比较好的应用,但其实这个确实也是经过大量的资金投入和一定时间的积累才可能做到的。反恐、嫌犯的定位,其实还面临很大的挑战,这种挑战就是因为我们现在流行的神经网络的人工智能,主要是一种监督学习的技术,它的整个学习的能力需要你给他提供标注好分类好的这些数据,有了标注好的这些数据,在数据源上标注出来说这个形状它是猫,这个形状是狗,这个形状是人,这个形状就是车,你要用几百万张图片标注过的样本让它学习,训练出这样的模型,它才具备学习的能力。
  比如说可能在病理方面,只有你收集到足够多的病理特征训练,它才能做得比较好,但是找到这些数据很难,需要人工去处理。当我们人工智能上有大量的数据积累,能够推动大量的人工智能的应用。实际还是有很大的挑战,甚至在中国市场上因为做人工智能,做AI很火,有时候我们想去买一些高性能的GPU硬件,在中国都有时候会断货,有时候有一些公司会去美国买带回来,硬件的生产能力可能现在也是不够的,还有性能方面也还需要亟待提升。
  虽然说眼前已经有很好的基础,但是从长远来说,这些提升还是需要有很大的空间。  [08-25 17:21]

主持人:
  谢谢,我也认同童总说的,现在我们对人工智能的应用处在比较初级的阶段,单纯就我们媒体而言,各家媒体已经在尝试运用人工智能的手段,进一步提升我们的工作效率。比如说刚才童总提到了我们在大量数据的识别,数据管理时候都会使用到人工智能的手段。王刚王总,视觉中国也是有一个海量的图片,图像,包括视频这样的素材提供商,和我们网络媒体一样,我们是作为内容信息的提供商,每天都在接触到大量数据要管理,不管是语音还是图像的,还是我们的文字,每天要耗费大量的人力去对这些信息进行管理,在这一块大数据的应用,人工智能应用有很大空间可以去提升,您对此有什么看法?  [08-25 17:28]

王刚:
  杨谷教授提到人工智能的两位教授,两弹一星和物理,给我老师做点广告,人工智能不是一个新事物,我理解它是一个新阶段,2016年前后,随着大数据技术的发展,包括我们数据积累不断加强,互联网,移动互联网等多方面的发展,积累到一定程度,我们用人工智能的技术,能够激活这些去发挥功能,我们有在线上亿级的图片,视频和音乐素材,非常大的一个概念,这么大的数据,每天还有几万张新图片在上线,我们面临着很大一个问题,要在内容生产方面就不断使用的人工智能技术,因为首先我们要实实在在过滤掉不合适的图片,而且要生成这些图片的关键字光靠人不行,我们通过通过向百度深度学习方面,还有包括跟阿里云都有很多合作。怎么把一张照片通过深度学习,把它的关键字自动标引产生,这个非常重要。同时,结合我们的网站,因为在支撑着应该说我们7000多家媒体,一万多个客户的每天搜索行为,自己本身通过搜索大数据来校正验证我们的关键字,跟刚才我们讲的一带一路,以前在词表里是没有的,还是需要人工的干预,进一步把数据进行萃取。
  有了数据之后,其实我们也在不断利用相关的技术来开发我们搜索算法,怎么让我们的客户,包括在座很多的朋友,我们的媒体朋友能够找到你想要的图片,甚至我们在开发我们自己的视觉内容的管理系统,能够跟客户来有效对接。包括我们的技术API能够跟我们在座各位媒体的平台能够进行深度的结合和集成,甚至能够辅助我们理通文字,做相关的配置,配图,很多新的领域我们都在做尝试。  [08-25 17:30]

王刚:
  三年前我在阿里集团,阿里集团每年有双十一节,从去年开始就使用AI技术,也就是说几千万张的海报不是人工做的,是机器帮助做的,今年因为它海报的元素,除了文字之外也包含很多图片,图像,我们也在紧密合作,让它通过人工智能技术自动生成相关的东西,来支撑我们的商业。
  所以,我个人觉得AI技术应该从现在开始还是有相当长的发展历程,随着我们相关技术,数据,整个这方面的发展,应该会在各行各业,特别像我们媒体这个领域得到应用,因为媒体行业涉及到文字,图像,其实这两个组成的还有版权,其实在座各位每一天不断在产生你们的深度报道,都是一个版权,这个版权的有效识别、标引、再用,都是可以不断把这些版权信息汇集成一个很重要的大数据信息,这部分都可以充分利用我们的AI技术,把它进一步增值。  [08-25 17:31]

主持人:
  说到AI,今日头条在算法这方面走得比较靠前,它最早做兴趣阅读机器推送自动分发平台,最早运用人工智能的搜索引擎来做新闻,刚才也有很多专家提到今日头条,它能够实现千人千网,千人千面,用户想看什么我就给你看什么,实际我们也知道其实在互联网上很多读者最愿意看,最想看的就是一些灰色信息。对这一类的信息提供,包括管理,今日头条是怎么做的,这方面请安总也介绍一下。  [08-25 17:33]

安娜:
  其实正如刚才孙总介绍,今日头条是国内最早将人工智能应用到信息的高速分发项目的产品,它是基于我们叫大数据挖掘的一款技术的推荐引擎,刚才我们陈教授和嘉宾都有介绍,它就是基于几个特征,我们找到很复杂的算术模型,找到文章和用户之间的关联进行推荐。
  今日头条作为智能分发的平台,我们致力于把最优质的内容和每个用户连接起来,所以这个方面也是尝试了很多,一直在升级算法,优化我们的这样一个算法模型。其实大家都有了解,在微信上我们一个爆款的文章应该是10万+,今日头条上起步应该是百万,甚至是千万+,这么大量的阅读量的内容呈现出来的时候,靠我们传统的人工来做肯定是做不到的,肯定有很多的算法,我们机器通过学习,通过算法优化来找到我们最优的途径,来把这个内容找到它最适合的读者。
  刚才孙总也介绍到,这么多内容我们怎么来做好管理,这方面我们也花了很多的心思,首先我们用人工智能来打压低俗,其实机器通过学习,以及这么长时间那么多的算术模型,词条量积累,基本上90%的一些低俗的不应该出现的内容,用机器都是可以拦截的。
  另外,加大了我们的人工审核,设立专家评委会,同时我们还有大量用户积极给我们反馈。这样会及时处理每一条这样的信息,基本上一些低俗、标题党、涉黄这些内容,在平台上绝对是禁止放出的,而且我们在智能化的前提下,也加强了我们整个的人工工作,刚才会议期间也跟很多嘉宾有交流,今日头条今年在我们人工审核团队投入力度非常大,在两个地区都建立了这样的人工审核团队,更好能够把我们的内容把关做好。
  另外,也是通过我们可以精准识别以及个性化分发的特点,今日头条也尝试在公益项目有所收获,其实大家做媒体的朋友应该有了解,我们前一段时间传播得比较多就是头条区项目,基于一个个性化推荐,LBS的精准点的弹窗,找到我们的人物信息,比如说这个人走失,根据他报告的时间,这个人的状态,我们来划半径进行这样的信息个性化推荐,就会及时有效能够找到这个人,目前来看我们已经有寻人寻亲2900多人。之后我们发现还可以做点什么,于是跟我们的公安,检察院有了合作,做了一个项目叫追逃,原理很相似,效果也还是蛮意外的,上线追逃跟公安和检察院相关单位打通这样的信息,上线时间三个多月,我们已经成功找到了38个在逃人员,如交通事故逃逸,还有小偷等,发生事情的时候,通过快速弹窗,通过精准地理位置推荐就找到了这些人。
  另外,我们又跟检察院合作一个项目叫追老赖,老赖应该是检察院很难处理案件中,很难找的人。我们跟河南检察院,法院,进行了合作以后,在周四,周五弹窗,找到了8个老赖,人工智能,除了刚才我们提到很多在内容分发上的优势,跟我们的生活,还有社会责任还是有很大的关联。我们现在的日活用户达到1亿人,平台越大,我们的责任和使命感越强,我们这方面也是在不断探索,希望用头条独有的优势技术,能够更好把我们的社会责任担当起来。谢谢。  [08-25 17:35]

主持人:
  未来人工智能技术大范围的应用,将会对我们媒体行业产生什么样的变革,发挥什么样的作用,再听听各位嘉宾在这个方面的看法。郝总,刚才有嘉宾提到他们已经用智能机器人进行写作,未来我们网络媒体是不是可以大幅度削减我们网络记者、网络编辑的人员?国外媒体已经很多这样做,中国网络媒体应该怎么应对这样的形势?  [08-25 17:39]

郝向宏:
  海峰提这个问题很好,刚才提四个问题,可以发现跟我们三位技术大数据支撑的负责人,两个维度,我的真实想法是这样的,正好回应您刚才提的问题。对大数据提出挑战,不是不要大数据,而是希望大数据发挥更加精准的作用,大家如果都知道气象的一些事,我们用机器感知,把一个地方的土地每隔一厘米安一个感应器,用足够大的计算能力来计算天气的变化,只可以精准一小时左右,一小时以后都算不准,所以说大数据如何更加精准,也就是说与大数据相应而行,我们要找到关键的小数据,这个才是决定事务发展的最本质因素。
  我的第二个体会,无论对于网络媒体还是其他各个行业,对于人工智能挑战不是不要人工智能,而是要求人工智能在服务人类本能方面发挥更大的作用。就是刚才童先生讲到的视频和脸部面部识别,有的技术可以达到99.9%,我们中国在一些公安领域应用挺多的,但是我觉得这个恐怕是纸面上是这样的,与实际当中的应用距离还是比较大的。我为什么得出这样一个结论,静海传销案发生之后,我们3位记者在那条沟里找到了54个人的通讯录,当把这些通讯录,有的人还有照片,给了天津公安方面以后,他们说光凭照片比对恐怕还一时关联不起来,还需要更多的数据,记者又把54个人的微信号和手机提供给了天津警方,警方动员全部力量跟这些大学生联系,帮助他们跳出传销的陷阱,所以说这个方面恐怕我们大数据还有更多精准广泛应用的空间。
  至于说大数据和人工智能,包括机器写稿是不是会形成对于网络媒体,新媒体,人力资源的替代,我觉得对于一般岗位编发稿件的替代,现在已经发生了,刚才一位同志讲到说机器写稿,机器发稿,都是很正常的行为了。但是,大数据,机器写稿,特别是这次九寨沟机器人25秒发出的稿件,我们认为这并没有什么稀奇,只是互联网+地震简单的复制而已,对我们的网站记者如何根据这些基本的信息进行救援,引导,特别是心理疏导提出了更加广泛要求,替代的只是一般性客观的岗位。由于这些被替代掉了,我们新媒体对于那些创造性的人性化和文化性的这种岗位需求会更加激发起来。
  用三句话总结一下我的核心意思,人工智能必须服从和服务于人类本能,就像库克在MIT领奖中讲到那样,他说我不担心机器像人一样思考,我最担心人像机器那样思考,这也就是我们想到当MBA这个工种初次产生效应以后,更大规模介入我们的媒体以后,美国人惊呼当MBA统治了新闻编辑室,我们如何保障,人工智能更大范围应用到新媒体,我们的价值观如何体现。
  第二句话,机器算法必须服从和服务于人性活法。
  第三个主题词就是智慧传播必须服从和服务于初心传播,我们的媒体是干什么的,我们的媒体职责是什么,对于这块土地,土地上生活的人们,他们的美好向往我们怎么服务,不能依据算法改变我们这个初心。  [08-25 17:42]

主持人:
  今天在座的很多都是我们网络媒体的老总,很多跟我们一样做内容生产和内容管理的,我们对技术并不熟悉,并不了解,今天下午的论坛上,海纳,拓尔思介绍了很多运用大数据,人工智能的手段为网络媒体服务,我和在座一样也很关心我们作为网络媒体怎么能够更好用技术改进我们的工作,提升我们的传播力和影响力,请童总继续给我们介绍一下您那的技术方式方法。  [08-25 17:46]

童剑:
  刚才提到人工智能对整个媒体市场的格局什么样的影响,都有一些关系吧,其实就是从事物发展规律来说,任何一个新技术出现的时候,必然会有一些公司出现会成为统治者,也有一些老的公司消亡掉,有一些公司适应变化,引入这些新的技术,能够跟上这些潮流发展,怎么样能够实时,或者及时去消化,引入这些新的技术切入,这是长远生存很重要的能力,媒体可以应用的新技术很多,比如从载体来说,可能前几年的视频,现在是直播,有时候还有一些语音的载体,微博,微信公众号,线上大的媒体平台,本身对于这些载体,我认为是很重要的一个方面。
  还有像人工智能这种技术的发展,怎么样去把它更好应用在业务中,比如说像语音交互,随着这样技术的更好应用和落地,可能媒体的交互方式也会发生很大的变化,我们之前通过屏幕,声音,去听去看,现在还可以通过语音或者手势,操作和交互这些媒体的介质,由于引入的语音或者是动作交互,可能我们媒体的介质也会变得更多样化,甚至可能会说万物都是媒介,可能你家里头只有音箱就是一个媒体的来源,可以让它给你放一首歌,选一新闻,让它播放一段你想看的音频,车里面你想看什么样的视频和新闻,新的技术引入,媒体可以交互的方式也会发生很大变化,我们媒体怎么样去找到这些交互方式。
  亚马逊推出来的音箱和云服务之后,亚马逊开放出来,它从过去两年开放出来这样一个平台要求,各种各样的,有的可能是其他的硬件通过API,通过亚马逊的音箱可以去操控连上它的其他智能硬件,这是一种连接。新闻集团,媒体也可以连上他音箱API,通过音箱除了可以使用亚马逊的这些媒介或者是这些内容资源之外,我可以去使用连接到这个平台上任何第三方的内容,所以说作为媒体,除了说我能够去使用这些载体之外,可能很多现在非常创新的,还处在发展的早期这些东西,也同样需要去关注,因为它真的有可能是下一个重要的媒体的交互入口。这是我的想法,我觉得我们媒体应该是要去快速引入这些新的交互的技术,或者新的这些载体,能够去扩展自己的这些渠道。  [08-25 17:50]

主持人:
  正如刚才童总所说由于新技术快速发展,使得现在我们用户对信息的需求愈发智能化,个性化,特别是作为我们媒体,在传播形态上也发现实际上要更好满足用户的需求,必须朝着我们信息传播的移动化和可视化这个目标来走。
  前一段时间,我们知道像直播,短视频,AR,VR都很火,一个又一个风口,接下来的阶段还会有哪些新的技术和平台在互联网上火爆,王总您有什么判断吗?  [08-25 17:55]

王刚:
  我觉得是这样,因为我自己是北航计算机毕业,学软件,随着软硬件和通信技术的发展,包括摄影技术发展,很多形象产生,从最开始拍摄简单的图片,主要传播图文,到视频,特别短视频,再随着移动端包括4G,5G起来之后,很多原来你不可想象的东西都变成可行了,真正的裸眼3D,譬如我们说千亿的图片,一张照片是千亿像素图片,保证两会每个人的信息都非常清晰,基于位置这些新的内容都变成可行了,这个方向大家可以真的是去畅想。
  物联网也是非常重要的方面,与这个变化相适应,相关的数据展现形态方方面面都发生变化,从这个层面我觉得媒体这个行业确实需要与时俱进,我个人认为,您刚才问这个问题是另外一个方面,我觉得我们媒体部门永远不会被替代的,就是你是内容生产者,每一个媒体都应该有意识把你自己的内容、你的数据有效积累,我实际上很想问在座每一位媒体的同仁,你们的媒体过去了几十年的文案,相关的图片,相关的东西,是不是有效存储了,这些结构化的存储大数据,也是我们未来通过我们人工智能技术产生新价值非常重要的基础,这个我觉得是大家都不可替代的,虽然我们说AR可以用人工智能技术有各种各样的展现存在,但是最核心的还是机器里的东西,这些东西是你的版权,你的版权无论是在国内的增值,还是版权将来行销国外,这个都是我们亟待重视的点。  [08-25 17:59]

主持人:
  大家都提到了人机交互,腾讯一位同行文章题目叫做“媒体行业也要适应人机交互”,很多人在下面留言,文章里也介绍到了像腾讯,百度这样的BAT公司,已经在布局人工智能这个领域,很多新的应用。今日头条下一步在人工智能技术发展阶段,比如说我更关心的是跟我们的这些网络媒体,包括和我们的政府有关部门合作上,或者说怎么通过我们的合作让我们大家都能够更好的去分享数字经济带来的红利,这方面今日头条有什么新战略布局?  [08-25 18:02]

安娜:
  您给我这个任务还挺大的,2016年,今日头条也成立了人工智能实验室,我们现在也在做的已经有一个我们叫机器人写作,最新推出来的产品,其他的产品还有属于秘密研发阶段,有些不大方便来说。谈到发展,尤其是我们媒体机构,我们一直是坚信认为媒体机构对于内容生产机构,它是优质内容生产者是毋庸置疑的,谁也不能替代的,所以现在自媒体很热,但是对比媒体的价值,其实我觉得因为可能这个市场的原因,把我们很多自媒体,经过几轮这样的投资,把他们的市场带动很热,其实媒体价值我觉得还是处于低估状态,因为我们处在媒体变化非常大的一年,很多媒体集团面临转型,甚至有的媒体,原来的纸媒和网站合并,只剩下一个新媒体的形态,我觉得变化真是非常大。
  我们自己出发点肯定是希望能够做好我们技术型的服务,我负责媒体合作,和媒体机构沟通很多,对于媒体机构不管是在原来,现在面临着新媒体技术日新月异的状态,尤其又在谈人工智能状态,他们最困惑的,最大的一个短板就是技术,对于媒体转型很多做新媒体最难的也是技术,从这一点今日头条也是非常认真在做研究,我们希望能够找到一种解决的途径,可以更好带大家一起来找到。
  顺着王总谈到的图片视频直播的话题,也是媒体的意义所在,孙总提到图片,视频到直播,你看这样一个坐标,越往右越接近新闻现场,这是所有人工智能都代替不了的,新闻现场我们的内容最终是怎么呈现回来的,刚才说第一时间我机器人写作,或者机器人报道,基于现在数据化的内容,体育新闻,财经新闻,包括刚刚地震数据化的新闻,你把它写成一个完整的报道是很有难度的。从这个来讲,我们头条的数据给大家做一个参考,短视频整个的播放量现在已经全部超过了图文,短视频叫播放量,图文叫做阅读量,这个大家可能想象不到,已经是它的1.3倍,而且这个数据还在继续拉大,这是去年年底的数据。所以说短视频已经去年是全部爆发了,今年我们又有一个媒体直播的产品,通过头条这样一个媒体型直播产品,有500多家媒体每天都会在头条发起直播,第一现场的新闻,每天差不多有几千万人是通过直播的方式获取信息,用户获取新闻的路径改变了,从以前看报纸,图文,去年的短视频爆发,到今年直播的方式。
  所以说以后会怎么样,其实未来变化太快了,没法说我们能够总结出一个方式。对传统媒体而言,第一是要开放,跟多平台合作,因为多平台合作肯定比自己来做一个小众的平台,它的传播,影响力都要大,这是第一的。二是加强自己优质内容生产,这是我们最强的,应该是最有市场竞争力的一个产品,我们不应该因为去追随新技术而把这个放弃掉。  [08-25 18:03]

主持人:
  作为一个媒体人感谢安总这句话,无论技术怎么发展,我们作为媒体还是要高度重视内容生产,重视我们的价值,如郝总说的那样,尽管现在机器人写作新的技术已经开始对媒体行业产生一定影响和变革,但是我们要坚信我们的媒体价值,媒体它是一个技术的出口,但更是一个价值的出口,所以应该坚守价值观,作为网络媒体还是应该坚定坚守下去,特别感谢几位嘉宾在台上跟我们分享你们的独特观点和前沿介绍,希望能够对在座各位有所启发,有所收获,感谢四位,也感谢网络媒体平台给我们大家交流的机会,谢谢大家,谢谢!  [08-25 18:08]