当前位置:主页 > 客户案例 >

内容科技(ConTech)元年白皮书

发布时间:内容科技(ConTech)元年白皮书

  人类历史上经历过四次传播革命:第一次是文字的发明,它让信息突破时空阻隔,可以“通之于万里,推之于百年”,标志着人类真正进入文明时代;第二次是印刷术的发明,它让信息生产和传播实现批量化,普及文化和教育,扩散知识和思想,人类进入大众传播时代;第三次是电信技术的发明,它催生了电报、电话、广播、电视,开辟了高效便捷的空中通道,人类拥有了“千里眼”“顺风耳”;第四次就是我们正身处其中的互联网革命,将前三次的成果融为一体,让我们走进了全媒体时代。每次信息传播技术革命都让生产、传播、获取信息的门槛越来越低,技术普及速度越来越快,参与文明进程的人群越来越广,都引发媒体行业和舆论生态的相应变化。文字的发明,满足了人类记录信息的需求,为人类准确表达和文化传承创造了可能;印刷术的诞生,为超越空间和时间的广泛交流、管理和统治提供了条件;电讯技术的普及,电报、电话、广播、电视,从单一形态内容的电子直传逐步发展到多媒体内容的远距离实时传输。以互联网为代表的现代信息传播技术,逐步打破了媒体按照媒介技术载体划分的格局,也模糊了大众传播时代明确的传者与受众区隔,不仅满足多媒体内容远距离实时传输,也模糊了传者与受众间的区隔,引发了内容生产、分发与消费全链条的变革。

  2、信息传播技术让传播方式、媒体格局、舆论生态发生深刻变化。首先,新一轮信息传播技术革命极大丰富和改变了传播样态。云计算、大数据、物联网、区块链、人工智能等改变了传统的信息生产方式,虚拟现实(VR)、增强现实(AR)、混合现实(MR)、可穿戴设备等丰富着媒体表现手段,微博、微信、客户端、短视频等网络媒体不断迭代更新,移动应用、社交媒体、问答社区、网络直播等新应用新业态不断涌现,跨时空、大容量、开放性、交互性、移动化等传播特点,不断塑造新的受众需求。随着5G技术的成熟与大规模应用,还将产生许多意想不到的信息生产方式、媒体表现手段、媒介传播形态和新的受众媒体体验等。其次,现代信息传播技术通过与内容产业的深度融合改变了媒体格局。以往具有舆论属性和社会动员能力的传播主体只有传统媒体,但在全媒体条件下,不仅传统媒体,政府机构、企业、个人都具有了广泛发布信息的能力,各类主体的传播参与度也不断提高。传统媒体通过采用新媒体语态、借助自建网络渠道、借力第三方平台不断制造爆款产品,受到数以亿计的关注;政府、企业获取了更为直接和便捷的信息发布渠道,可以不通过媒体直接对外发布信息;个体用户通过社会化媒体追踪热点、参与讨论,形成强大的传播能力。传统媒体独占传媒市场的时代一去不复返,新旧媒体联动、专业媒体与非专业媒体共生、媒体内容和用户与机器生成内容兼有,使得传媒市场走向多元力量共享共生的生态格局。媒体的外部关系因此被重置,“跨界”“出圈”正成为一种普遍现象,而在“万物互联”的时代,“跨界”“出圈”将是常态。技术的发展令新闻媒体从围墙里的内卷式发展逐渐变为突破围墙的外延式发展,与更多市场主体展开联系,进入更多新的领域拓展。最后,信息传播技术演进引发舆论生态诸多变化。大众传播时代,想把同一条内容信息传给数以千计的人群,成本很高,不用说个人,就是小型机构都不敢奢望,只有媒体才有大型的印刷和录制播放设备,以及庞大的邮发体系和传输频道。而在移动互联网时代,只要会敲字,就能在微博上留下140个字,直抒胸臆,有可能让世界任何一个角落里的人们看到。抖音等短视频应用,更是连文字输入都免去了,只要手头有一部能录像的移动智能终端,镜头前略加展示,连声音带图像便都可上传至网络空间。短视频已经是比文字门槛更低、成本更低的信息生产与传播方式。随着传播门槛的降低,参与传播的人群越来越多样,甚至也不再局限于人类,人工智能技术让机器也加入内容生产的行列。低廉的生产、高效的传播、广泛的参与,史无前例。随着移动互联网、O2O、人工智能等发展,连接已不足以代表网络传播的特征,更新的趋势是内容和用户精准的对接,舆论空间出现前所未有的分众化、圈层化。主体的多样性、思想的多元化、场域的差异化,使得舆论场从来没有像当今社会这样纷繁复杂。

  3、信息传播技术推动内容与科技深度融合。“媒体融合”一词源自于计算机在新闻信息领域的应用。自上世纪40年代中期计算机问世以来,人类逐步迈向信息社会,以电子信息技术为基础,以信息资源为基本发展资源,以信息服务性产业为基本社会产业,以数字化和网络化为基本社会交往方式。由于信息技术革命突破了人类大脑及感觉器官加工处理信息的局限性,使得媒体加工、利用信息的能力极大增强。媒体发展的驱动力从以内容为主转变为以内容和技术双轮驱动,技术和内容越发紧密地结合在一起,技术在媒体发展中的作用变得空前重要,技术决定了媒体内容的呈现形式、抵达用户的速度和广度,改变了与用户交互的方式。在信息化时代,内容更多依托数字技术、网络技术、人工智能技术等信息化手段进行生产、传播,全流程与技术交融。一方面,高清摄像头、音视频采集制作、机器辅助写作等技术为个体提供了强大的内容生产工具,为全社会成员参与信息传播赋能;另一方面社交网络、区块链、大数据、云计算等技术使得内容生产关系中各类主体的地位作用发生了深刻变化。全球巨型互联网平台的相继崛起不断上演着技术与内容产业的联姻。这些都说明,技术与内容深度融合正成为一种不可逆转的趋势,内容产业比拼的不再是掌握内容资源的简单数量,而是用技术统合调配各种内容资源的能力。“适应社会信息化持续推进的新情况,加快传统媒体和新兴媒体融合发展,充分运用新技术新应用创新媒体传播方式,占领信息传播制高点”,成为顺应这一趋势的必由之路。

  1、科技推动内容产业变革。“科学是一种在历史上起推动作用的、革命的力量。”内容科技作为新型生产力,必然需要新的生产关系与之相适应。因此,技术深刻影响了媒体的生产力,而更加深刻的是重构了信息生产传播的生产关系,改变着媒体与受众、媒体与媒体、媒体与其它行业部门之间的关系。纵观人类社会发展史,社会化分工在参与主体的横向维度与工种细分的垂直维度上不断发展。哪个部门能够占据中枢地位、广泛参与社会化分工,就拥有了未来话语权和自身的永续发展。在此条件下,价值链被重新组合,媒体的外部关系因此被重置,单凭一己之力掌握从生产到发行全链条的时代一去不复返。媒体只有形成顺应生产力新要求的新型生产关系、加入到更加广泛的社会化大分工之中,才能找到正确的发展方向。媒体不仅是新闻发布者、信息传播者,也是服务提供者、关系构建者。“媒体要向基层拓展,向楼宇延伸,向群众靠近。”为此,主流媒体要将更多的社会资源带入到自身的生产流程,通过提供多功能服务参与到其它部门的生产过程,发展综合产业链,努力推动自身与用户及其它生产部门之间的关系从弱到强,建立起牢固的社会“信任机制”。而技术成为推动这种变革的重要抓手。

  2、内容产业的双重属性呼唤内容科技“逆向输出”。在互联网技术向各个领域渗透的过程中,基于对网络多元主体均等化局部和表象认识,互联网“去中心化”的提法一度甚嚣尘上。但随着互联网产业的发展,特别是移动网络应用逐步打通网上网下,现实利益与规则不断适用于网络空间后,人们越来越意识到,互联网“去中心化”只不过是一个口号,现实中,更多的是在经济资本、社会资本与文化资本集聚基础上的互联网“再中心化”。大型科技公司通过搜索、社交、视频分享和聊天服务,吸引数以十亿计的用户,日益成为汇聚新闻信息、探讨公共事务、推动社会舆论的超级舆论平台,通过技术输出不断进入内容产业领域。如果放任网络空间以逐利为主要目的的“再中心化”,只能造成垄断加剧、社会裂痕加剧,甚至影响国家安全。特别是,相较其它部门和产业,内容产业具有信息服务属性和意识形态属性双重属性。因此,内容科技的发展应本着马克思主义的立场、观点和方法,不断发现规律、掌握规律,在为社会提供大规模个性化信息服务的同时,成为传播社会主流意识形态,凝聚社会共识、推动进步发展的支撑力量。

  1、顶层架构重视内容与科技的结合。党的十九大以来两年时间内,中央政治局举行的集体学习中有4次主题涉及互联网领域最前沿、最关键的科技或应用:2017年12月8日,就实施国家大数据战略举行第二次集体学习;2018年10月31日,就人工智能发展现状和趋势举行第九次集体学习;2019年1月25日,就全媒体时代和媒体融合发展举行第十二次集体学习;2019年10月24日,就区块链技术发展现状和趋势进行第十八次集体学习。每次集体学习既强调了新技术新应用的快速发展态势,更强调其对政治、经济、文化、社会、生态的全方位影响,高度重视技术与涉及内容的各个领域的结合。

  2、全媒体的建设已经成为我们面临的紧迫任务。在第十二次集体学习时,习总书记发表重要讲话强调,“全媒体不断发展,出现了全程媒体、全息媒体、全员媒体、全效媒体,信息无处不在、无所不及、无人不用”。“四全媒体”的理念,全面突破了信息传播的时空尺度、物理尺度、主体尺度和功能尺度,媒体定义被重写,媒体支撑体系被重构,传媒产业市场被重塑,媒体外部关系被重置。媒体融合已进入“深水区”,在建设全媒体的道路上没有现成模式,没有固定范例,还面临着一系列亟待破解的难题。与此同时,从全球范围看,媒体智能化进入快速发展的阶段,人工智能将被运用在信息采集、生产、分发、接收、反馈等各个环节。人类逐步踏入万物互联的5G时代,内容产业面临横向打通各行各业、深度融入各行各业,激发全新业态的新机遇。这一切变化都增强了内容部门加速全媒体建设的紧迫感和使命感。

  3、内容科技是建设“四全”媒体的手段和路径。“四全”媒体的提出不仅是针对信息传播技术发展这一新型生产力的准确判断,也是对全媒体时代的媒体格局、舆论生态、信息生产传播方式等生产关系层面的重要论断和改革部署。内容科技是建设“四全媒体”的重要手段和路径。由此,2019年也成为内容科技元年。通过发展内容科技,内容产业部门得以在基础层不断加强技术研发投入,抢占科学技术发展先机;在平台层汇打通各个领域,汇聚各类资源;在应用层服务社会的各个方面,不断巩固作为社会传播中枢的地位。通过这一过程,汇聚起各方数据,真正掌握全媒体时代的关键资源。通过对数据的掌握与利用,不断形成新的内容能力,并将此种能力向各个领域进行输出,真正建立起“四全”媒体,形成符合全媒体时代要求的生产机制。

  在一般意义上,内容科技(ConTech)是指以人工智能(AI)、大数据等信息技术为内核,对内容产品的生产与消费链条、内容产业的组织与分工模式产生重大影响,包括区块链、物联网等在内的一系列数据与信息采集、存储、加工、传输的新技术,这些技术催生了内容产业领域的新应用、新服务。

  当前的内容科技主要包括数字技术与数据技术两大类。其中数字技术的应用是在信息数字化(数码化、数位化)基础上,进行内容生产加工的技术;而数据技术的应用强调了对信息分解与综合运用的过程,即找到一个信息所包含的各种元素,从而发现不同信息之间更深层的联系和区别。因此,内容科技经历了从信息处理技术到数字技术再到数据技术的发展。在这一层面上,狭义上内容科技可以分为内容生产和内容分发两个方面。

  如今,人们对客观事物矛盾运动所发散出的各种讯息和信号的采集,由于传感器的大规模使用,已经发展到了“数据”层面。而大数据技术使人们能够打破信息的外壳,发现信息背后事物更本质的联系,从而使信息的生产、分发、接收和反馈能够借助智能化工具,进入到一个新的阶段。由此我们看到,信息化时代的内容科技使得“内容即数据”,信息传播得以智能化。

  在当前内容科技的发展中,人工智能、大数据、5G及物联网和区块链等新兴科技的应用起着重要作用。其中,人工智能技术和大数据技术属于信息技术(IT),是内容科技的核心技术。人工智能是研究如何应用计算机的软、硬件来模拟人类某些智能行为的基本理论、方法和技术;大数据技术主要以“数据价值化”为核心进行数据的专业化处理,涉及到数据采集、数据整理、数据存储、数据安全、数据分析、数据呈现和数据应用等技术应用。通过大数据技术,人们可以对机器采集的数据和对人体感官所获得的信息解构化的数据进行整合、清洗、加工和标签化等处理,从而形成由无数数据集组成的数据库。通过人工智能技术,人们可以对上述数据进行关联和归属,为机器学习中的模型训练提供数据基础,并应用于对数据库进行分析运算,以实现人工设定的特定性能。

  区块链和5G及物联网基本上属于通讯技术(CT)。区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式,可以用来有序地整合信息,有效地验证信息;5G及物联网能够将各种设备上安装的传感器接入网络,实现任何时间、任何地点的人、机、物的互联互通,使关于自然环境和人们活动状态的数据能够被采集,成为内容生产的重要数据来源。总体而言,当前的内容科技,是以人工智能技术为核心的新的技术体系。

  文字出现之后,人类经历了漫长的手抄传播阶段。建立在纸张和印刷术发明的基础之上的印刷时代的到来,结束了手抄传播效率低、规模小、成本高的状态。造纸术和印刷术是中华民族为世界文明作出的两大贡献。15世纪40年代,德国工匠古登堡在活字印刷和油墨技术的基础上,创造了金属活字排版印刷,并将压榨机改装为印刷机,实现了文字信息的机械化生产和大规模复制。欧洲工业革命推动了印刷技术的革新,使之进入到机械动力和电力生产的阶段,并推动了近代报刊的诞生。

  模拟时代,信息以附着在纸质或其他介质上的图文形式和模拟信号的方式传递,报纸、广播、电视的广泛普及,共同成就了大众传播模式的辉煌。这一时期,专业化的媒介组织运用传播技术和产业化的手段,以社会上一般大众为对象,通过收集大量外部讯息并经过加工处理(主要通过人的感觉器官及人脑)形成结构化的信息后,进行大规模的信息生产和传播活动,信息生产和处理方式呈现工业化生产特征。同时,电子技术使人类体外化的声音信息和体外化的影像信息得以长久保存。卫星通信技术、卫星广播和卫星电视的发展和普及,使全球传播成为可能。

  数字时代,信息传输高速便捷,大众传播的传播技术手段以数字制式代替了传统的模拟信号,广播、电视的音质与画质得以提升,频道与节目资源更加丰富。数字信号传输技术改变了过去传播资源短缺的状况,多样化的信息需求被重视,受众市场趋于细分化。计算机的出现,使电脑开始执行人脑的部分功能,意味着人类大脑这一信息处理中枢开始了体外化的进程。互联网的普及促使信息由单向传播转变为交互式传播,信息发布不再是集中化模式,信息流通更为自由,形成了海量信息源。互联网媒体平台化的发展,使海量信息得以快速聚合和传播。

  近40年,中国的信息传播方式经历了从“铅与火”的传统铅字印刷到“光与电”的数字化内容生产和复制的巨大飞跃。20世纪70年代,西方已经采用“电子照排技术”,即利用计算机控制实现照相排版印刷,中国仍在沿用传统的 “以火熔铅、以铅铸字”的铅字排版印刷技术,这种方式能耗大、劳动强度高、环境污染严重,且出版印刷能力低。为改变这种状况、跟上世界信息化发展步伐,必须将汉字与计算机技术相结合。1975 年,王选院士开始主持中国计算机汉字激光照排系统和以后的电子出版系统的研究开发,他的目标是直接研制世界尚无成品的第四代激光照排系统,即在电脑控制下将数字化存储的字模用激光束在底片上感光成字、制版印刷。王选使用“轮廓加参数”的数字方法来描述汉字字形,将字形信息压缩500倍至1000倍的同时实现变倍复原时的高速和高保真,这一技术攻克了汉字字形信息的计算机存储和复原的世界性难题。至1990年代初,王选带领团队先后研制出了八代激光照排系统产品,被中国大陆99%的报社和90%以上的书刊出版社和印刷厂采用,中国印刷业从铅板印刷直接步入激光照排阶段,跨越了国外照排机40年的发展历史。世界上首个“汉字信息处理与激光照排系统”的成功研发,在中国掀起一场印刷业的“光电革命”,这也成为我国内容科技迈入数字化时代的重要开端。

  从1980年代开始,随着数字电子技术的逐渐成熟,广播、电视的音质与画质提升,频道与节目资源更加丰富,改变了过去传播资源短缺的状况,多样化的信息需求被重视,受众市场趋于细分化。数字多媒体技术的广泛应用,实现了通过数字方式,集计算机、通讯和声像技术于一体处理声音、图像、文字和数据等信息并进行混合传送,推动了媒体形态的革新。

  数据时代,信息的数据化为利用人工智能处理数据和信息通过了基础条件,推动了传播资源和传播手段的极大丰富。“受众”向“用户”的转变,使用户成为关系网络和信息传播的重要节点。人工智能技术在信息采集、生产、分发、接收和反馈的全流程的应用,将使人们能够顺应互联网平台的开放趋势,关注由于公众广泛参与带来的传播关系的变化,结合大数据技术,全面服务全媒体时代互联网用户的信息需求和社交需求。

  2019年1月25日,习总书记在中央政治局第十二次集体学习时强调,“全媒体不断发展,出现了全程媒体,全息媒体,全员媒体,全效媒体。信息无处不在、无处不及、无人不用,导致舆论生态、媒体格局、传播方式发生了深刻变化,新闻舆论工作面临新的挑战”。

  “四全媒体”的论述,是基于互联网、大数据以及人工智能技术的发展趋势,对于媒体未来发展的分析和判断。这里的“全媒体”,不单指媒体种类的“全”,更强调了当前人类信息交互的“全程、全息、全员、全效”等特性,这些特性只能依托互联网技术产生和存在,为当前内容科技的发展提供了应用环境。

  “全程”和“全息”是当代传播的技术环境,是现代信息技术革命的成果,强调了更为丰富和多样的信息来源。其中,“全程”是时空维度,指客观事物运动的整个过程都会被现代信息技术捕捉、记录并存储;“全息”是信息状态维度,指反映物体在空间存在时全部情况的信息,强调了媒体信息采集及呈现形态的多元化。物联网技术的发展,传感器的广泛应用,极大拓展了内容来源,丰富了内容载体。5G技术的“广接入”特征,加速了万物在线、万物互联的实现,改变了个人对外部世界的认知方式,并使人类的大数据采集能力发生革命性变化。“低时延”的特征,极大提升了计算机的运算能力。在全面部署传感器并接入5G网络的基础上,全程、全息采集数据,从而推动了全媒体时代的真正到来。

  “全员”是社会维度,是在信息技术革命推动下社会信息化持续发展的结果,强调了社会方方面面各种主体(个人、各种机构等)都在通过网络进入到社会信息交互的过程中,成为可能的信息源,即所谓的“人人都有麦克风”。从社会发展角度看,“全员化”顺应了普通公众参与社会事务的需要。全员参与拓展了来自于用户的内容来源,同时,基于大数据技术的精准分发方式的转变,能够更有效地满足用户的多样化需求。人与人的连接,不仅能够为全息化提供更为丰富的应用场景,也能够利用人工智能技术,更好地帮助用户建立社交关系。

  “全效”是媒体功能维度,指媒体功能的全面化、平台化发展。新型媒体平台通过为用户提供全面化的服务功能和多元化的应用场景,来获得更为丰富的用户数据和信息以及各种社会资源和社会运转的数据,并由此作为主要的价值变现模式,这使得新型媒体平台必然成为社会的数据总汇和运营枢纽,连接起政府、企业和个体等在内的不同社会主体的社会实践和行动。而这样的功能,既需要通过人工智能的应用来实现,也需要区块链技术保障信息汇聚的有序性,以及大数据技术精准、高效地满足用户全方位的需求。

  当前的内容科技,是以人工智能技术为核心的新的技术体系,表现出以人工智能驱动内容生产、消费全链条,以数字化生产、网络化传播为主要应用场景,以主流价值和意识形态引导与社会共识达成为重要指向的特征,具体表现在以下四方面:

  第一,数字形态。内容科技将复杂的信息转变为可以度量的数字、数据,再将这些数字和数据建立适当的数字化模型,并把它们转化为一系列二进制代码,引入到计算机系统中进行处理,这就是信息的数字化过程,是为了使解构化的信息能够被计算机所识别和加工。同时,数字形态更便于信息的传送、存储和复制,可实现多种渠道的线性或非线性传播。数字化促生了信息传播网络和终端的融合,导致内容产品格式及其生产过程和组织的融合。

  第二,数据处理。内容科技将数据处理贯穿于信息生产和传播的全流程中。智能化采集的数据来自机器的智能采集和来自人体感官所获得的信息进行解构、并经机器识别和处理后形成的数据。智能化生产是对采集到的数据进行处理、分析和加工,并根据功能设定指定相关应用所遵循的规则和标准,研发相应算法和程序,对机器学习中的模型进行训练。智能分发是对内容数据与用户数据标签化处理后的相互匹配。智能接收是通过智能终端设备实现用户行为数据的收集。智能反馈是通过智能终端入口自动化获取反馈数据。

  第三,网络传播。当前内容科技的主要传播载体为互联网平台和移动互联网终端。信息传播特征表现为信息资源的极度丰富,信息传播的强时效性,信息表现形式的多元化,信息传播模式的强交互性。内容科技将进一步推动互联网向平台化、智能化和移动化转型。平台化表现为数据总汇在同一平台上分享、交流信息和资源,多种垂直应用联结成为生态级平台;移动化表现为完善基于移动传播体系的精准传播;智能化表现为大数据与算法结合的人工智能的进一步发展。

  第四,对社会成员价值观形成的外部性影响显著。新兴内容科技所形成的虚拟网络环境,与现实社会共同构成了现代人类生活的主要空间。伴随公众使用智能终端设备时长的增加,内容科技对个体价值观的影响日益凸显。信息分发方式的转变主要表现在信息所表征的事务与个人利益相关联的深度和广度上,一定意义上体现为信息对个人社会化程度的影响,即特定个体与所处的社会环境建立一致性的影响。作为社会关系总和的个人,其利益的实现,在很大程度上取决于该个体是否适应其所处的社会环境,尤其在涉及社会交往和公共事务方面。依托内容科技,能够促进个人的社会交往关系建立,同时,基于用户需求分析的主流价值观引导,能够实现个体利益与公共利益的平衡和统一,有利于社会共识的形成和社会决策的制定。

  移动化为内容产业带来了前所未有的海量数据资源,智能化推动了以人工智能为核心的数据处理技术的大发展。当前,内容科技以大数据为基础,依托各种智能算法模型,在智能识别、计算机视觉、自然语言处理、数据可视化处理、算法推荐等方面已形成相应的技术应用能力[1],围绕着信息采集、生产、分发、接收、反馈五个环节的智能化展开其应用,推动着内容产业全链条的变革和重塑。本部分将从内容采集、生产、分发、接收、反馈五个环节,全面梳理和探讨智能化内容科技的应用前景。

  内容科技助力内容采集智能化。区别于普通的内容采集,智能采集以数据为采集对象,即通过数据的采集和分析,拓宽内容素材的来源途径和内容采集的维度。在传统的内容生产中,素材的挖掘和信息的获取多有赖于内容生产者身体可到达的边界,而数据的采集则大大突破感官采集的限制,为智能化内容生产创造条件。

  数据是人类表征外部世界的初始化的符号,是记载客观事物的性质、状态以及相互关系等的物理符号或这些物理符号的组合,是内容的数位化表现形式和载体。内容采集智能化的核心即在于数据化(datafication),具体包括机器采集数据的“结构化”和感官采集内容的“解构化”。例如,摄像头、传感器等设备可以在更广范围、更大程度上扩充来源与环境信息;图像和视频识别技术可以基于深度学习进行大规模数据训练,实现对图片、视频中物体的类别、位置等信息的识别,实现场景信息实时采集;而语音识别和转化技术则可将现场的语音报道生成文字版或将音视频内容转化成为文本素材,提升了内容素材生成和管理的效率。内容“解构化”的关键技术是自然语言理解技术(Natural Language Understanding,NLU),旨在通过句法分析、语义解释和上下文推理,使计算机能够理解人类自然语言的文本意义和深层意图,完成从文本到意义和意图的映射,进一步实现内容的“标签化”。

  机器采集数据的“结构化”,指借助各类数据采集设备(各类监测设备和传感器)采集数据,并通过机器实现数据清洗、整理、分类,形成可用的数据库。在此基础上,合成数据库则可实现多来源数据的有序整合,为海量数据的处理和数据库的开源扩展提供可能。例如,BBC新闻实验室开发了人工智能工具“Juicer”,可以把包括新闻快讯、专题报道、视频新闻、政府公告、社交媒体信息等在内的海量数据汇集在一起。当记者需要调取关于某个主题的新闻或信息时,“Juicer”能够快速提供一个包含相关内容的清单。

  数据的智能采集也离不开智能识别。过去各类内容生产中所涉及的特定对象的识别与判断,主要取决人的感官。内容生产者的准备充分程度与判断能力会影响到采访的深入程度,而数据采集技术则可以帮助人快速识别某些对象并采集相关信息。例如,摄像头、传感器等设备可以在更广范围、更大程度上扩充来源与环境信息;图像和视频识别技术可以基于深度学习进行大规模数据训练,实现对图片、视频中物体的类别、位置等信息的识别,实现场景信息实时采集;而语音识别和转化技术则可将现场的语音报道生成文字版或将音视频内容转化成为文本素材,提升了内容素材生成和管理的效率。

  内容采集智能化的另一特点是可以实现感官采集内容的“解构化”。互联网内容与资源交换的平台化,及社会普遍信息化支持下的“全员媒体”生产内容,形成了海量的关于社会公共事务和社会生活的内容数据。利用内容科技对于移动互联网的海量内容进行处理,可实现“内容数据化”的过程,以此来实现对社会各类信息内容的全范围采集和数据化,为建立内容丰富功能强大的内容数据库提供原料。

  内容“解构化”的关键技术是自然语言理解技术(Natural Language Understanding,NLU),旨在通过句法分析、语义解释和上下文推理,使计算机能够理解人类自然语言的文本意义和深层意图,完成从文本到意义和意图的映射,则进一步实现内容的“标签化”。根据应用的场景,自然语言理解可以分为基于文本的应用和基于对线]。基于文本的应用主要应用于阅读书籍、报纸、报告、邮件等书面文本;基于对话的应用应用于人机之间的通信,典型的应用有问答系统、自动客户服务系统等。由此,无论是文本内容还是人机互动内容,均可在NLU技术处理下实现标签化,即打破内容文本的“外壳”,发现内在的联系。

  在智能采集数据并对数据进行分析的基础上,内容科技助力内容生产智能化,即根据人类生产生活的各种场景需要而展开内容生产,具体包括自动生产、智能聚合、制作增强、内容审核等多个层面。

  以大数据、传感器等为代表的内容科技发展,推动了从人工采集信息到机器采集数据的提升。而在拥有大量数据的前提下,如何将数据分析处理成为可让人类感官能够有效识别、接收的内容(可为文本、图片、视频等多种形态),则成为内容生产的关键之一,即实现数据可视化处理。

  目前,依托数据可视化处理的计算图像技术、视频生成技术等已投入实践。例如,计算机视觉可以在拍摄对象之前就通过卫星定位判断最佳拍摄视角。计算图像技术可在运动画面中寻找最佳帧,实现瑕疵图片的再加工、无缝添加或删除对象等。视频生成算法则可在多样化的视频数据采集基础上进一步生成“以假乱真”的视频,由华盛顿大学研究员制作的奥巴马演讲视频便是典型案例。基于此,数据可视化未来将突破现有以信息图表为主的基础应用,而迈向音视频加工、VR、AR内容制作等更高层次的应用,从而实现数据生成内容的全息化贯通。

  自动化生产指利用智能算法工具自动生产内容的新型生产模式,基本特点是从数据源自动获取数据、使用算法进行内容整合,并完成拟人化的内容生产。其中实现自动生成的程序也被称为“写稿机器人”(包括文字和视频创作)。在国外,早在2014年,美联社就率先引入人工智能编辑Word Smith,可以自动生成财经新闻。同年,《洛杉矶时报》新闻机器人Quakebot则率先实现地震新闻的自动播报,被称为“自动化新闻在欧美发展的里程碑事件”。在国内,腾讯Dreamwriter、新华社的“快笔小新”、今日头条的Xiaomingbot等写稿机器人也在2015年之后逐渐发展和成熟起来。2017年四川九寨沟发生地震,中国地震台网站的机器人仅用25秒时间就快速生成和推送了关于地震的快讯报道。

  写稿机器人依托的核心技术是自然语言生成技术(Natural Language Generation,NLG)。早期的写稿机器人主要遵循“提取数据-套用模板-生成稿件-人工把关”这一模式化的生产流程,主要实现结构化数据的处理和人工模板的填充[3],缺乏灵活性。而在NLG技术的进一步运用中,机器可以在挖掘分析海量多媒体内容素材之后,依托深度学习算法实现语义的自动匹配,根据具体的题材建构起特定的篇章结构,并进一步落实在词句语法中,最终形成流畅的新闻。今日头条的Xiaomingbot是这类写稿机器人的代表,其在基于文字直播的新闻自动生成以及语言情感自适应等技术上实现了突破[4],走出了对人工固定模版的依赖,而从大量非结构化的文本、视频等内容中生成新闻报道。

  依托内容科技的海量内容搜集能力和智能分析能力,可为碎片内容的整合提供新的可能,协助内容生产者快速建立碎片化信息间的联系,进一步强化内容生产力。例如,从同一个报道主题出发,通过智能化工具自动分析新闻信息,进而实现图、文、音视频等多种内容形态的智能组合;从热点新闻话题出发,通过大数据智能化分析与抓取相关新闻资讯内容,形成聚合专题,实现新闻策展,增强报道全面性和解释力。

  此外,一些国外的新闻机器人已经开始尝试“千人千面”的内容制作,根据对用户偏好的判断调整文本标题、摘要甚至段落。《华盛顿邮报》的网站便可为不同所在州的用户提供当地的种族情况报告,这一报告是由人工智能工具生成的。“这种内容不再是一对多式的,而是一对一的定制写作和传播”,邮报的负责人Gilbert认为,“比起满足读者普遍兴趣的内容,我们更希望讲述一个满足个体兴趣的故事”。

  移动互联网时代,虚假信息和不良内容数量激增,对于内容的核查与判断的任务也变得更为艰巨。智能审核工具通过摄入大量的真实和虚假内容进行对比、统计分析,根据准确性、确定性等指标对一则未知真假的新闻文本的真实性概率进行估算,评估其为假新闻的风险。2015年, MIT科学家收集大量谣言, 构建监督学习依赖的标签数据集,提取假新闻的语言风格、参与传播信息的用户的特征以及网络传播动态,借助隐马尔可夫模型根据以上特征对目标文本进行分类,初步实现了对假新闻75%的识别准确率[5]。

  随着技术的发展, 如今智能化自动核查系统可以做到更精细化的信息鉴别,例如将社交媒体上的不实推文区分为伪造信息、广告、标题党、恶作剧四种子类型,对图片等多媒体内容进行鉴别。同时,内容核查系统的应用范围进一步拓展,除了识别实时的虚假新闻,还可以检测具有较长生命周期的知识类谣言,并实现从多个冲突信源中进行真相发掘,进一步识别社交媒体上的恶意用户和机器人等。

  智能化的内容核查系统可以自动帮助用户检测和过滤潜在的虚假信息,并为内容生产者核查事实提供辅助,成为一种新型“把关者”,以人机力量的协同来更多地对抗虚假信息、不良内容的风险。

  内容科技助力内容分发智能化,即通过内容与应用场景的智能匹配,提升内容分发效率,充分实现内容价值。当前,海量内容供给与大规模且个性化内容需求的精准匹配,是移动传播时代的内容服务商必须完成的命题,而基于算法推荐技术的精准分发为这一命题提供了高效率、低成本的解决方案。当前的智能分发主要表现为智能化的内容分发和智能化的社交分发两类模式。

  智能化的内容分发,指基于内容标签来响应用户不同场景下的内容需求,以提高分发的适配度和传播效率。智能化的内容分发与内容的标签化和用户需求的场景化密切相关。内容标签化即利用数据库技术对内容资源进行有序化、结构化和标签化的处理,一方面由相关领域专家划定基础分类和知识重点,形成一套知识库形式的基础标签,并结合内容生产者自定义标签进行优化;另一方面,通过用户的搜索命令和互动指数等映射内容标签,最终建构起具有内部关联性的内容知识体系,为进一步的用户个性化匹配奠定基础。用户需求场景化则指对于用户空间环境、实时状态、用户生活惯性和社交氛围等多维度要素的精准捕捉。

  智能化的社交分发,以公众广泛参与为背景,通过算法促进社交关系的建立,依托智能化的社交关系提高信息分发效率。当前的主流推荐算法中,算法与社交结合已成大势所驱,主要应用包括亲密关系加权算法、重要关系加权算法、互动加权算法等。在“全员媒体”时代,大规模的用户参与、集聚必将形成用户关系网络,但用户之间的关系并非具有同等的价值,因而,通过对关系的建立和筛选实现内容筛选成为智能化社交分发的重要思路。

  但不可否认,当前精准分发的算法规则,大多表征资讯内容对用户的趣味性指标。对于使用移动终端的用户而言,受兴趣牵引的点击会偏向于娱乐性和猎奇性较强的内容,而主要基于点击量取值的算法规则,又会把这类内容推送到更大范围,在商业资讯平台上虚假和低俗信息的大量传播就是典型例子。

  未来,智能分发的良性运行,有必要探索以主流价值观驾驭算法,更全面地考虑用户个人更本质的信息需求,尤其是个人在社会化过程中用于建立其个人与社会的一致性的内容需求;既充分满足其合理、合法、合规的个性化需求,也通过分析用户信息结构,针对其不足之处,精准推送相关内容,以此为基础提升智能分发的科学性。

  内容科技助力信息接收智能化。智能接收主要通过终端设备信息接收系统的智能化来实现。终端是指使最终的内容产品得以呈现的物理设备。当前传播体系中的主流终端主要包含个人移动终端(如智能手机)和家庭终端(如家庭大屏),而伴随着5G技术的逐步普及,信息接收终端的智能升级也迎来多重机遇。首先,5G的广接入带来万物互联,可穿戴设备、智能家居、智能汽车等均有可能形成新的人机界面和交互方式;其次,5G的低时延使得端云协同变得触手可及,意味着边缘设备(即终端)也能够实现更多的计算能力,终端信息接收系统的信息分析、过滤与呈现等将得到进一步升级。

  从国内外现有实践和研究的成果来看,AI芯片组(AI Chipsets)的应用,为终端设备智能化的实现提供了可能。未来各类终端系统可在此基础上,搭建起智能入口,通过在终端对用户所接收的信息进行智能分析,对内容进行审核与过滤,通过向用户发出提示信息等方式,培养用户良好的媒介使用习惯,以营造健康的媒介环境。只有将智能接收与智能分发有机结合,才能在最大限度地满足用户需求的基础上,保证用户接收信息的全面性,实现个人化的需求与社会整体利益的一致性,更好地传递主流价值观。

  以可穿戴设备为代表的智能终端大大拓展了智能连接的疆域,依附于人体特征打造更加多元的人机界面。设计师安迪·古德曼将用户不通过观看或点击来获取内容的行为称之为“零用户界面”。而以可穿戴设备、智能家居、智能汽车等为代表的新型终端,最大的特点便是摆脱屏幕限制的思维模式,内容的接收和处理可通过多种感官体验实现,用户只需记住驱动智能设备的命令即可实现。

  多终端的智能化信息接收,离不开终端内嵌的“智能信息助理”,即各类语音识别与处理系统。当前,大型互联网企业均在积极布局其智能语音市场,推出Siri、Alexa、天猫精灵等数字语音助理,而Messenger、Quartz等移动应用则推出了智能化的新闻聊天机器人。区别于简单的信息关键词检索,依托于前述的自然语言理解技术,智能助理可以对用户的对话进行意图识别和实体抽取,结合上下文理解用户对话中所提供的信息要素,从内容库中调取与用户信息匹配的内容。根据Future Today Institute发布的《2020年娱乐、媒体和技术趋势报告》,可跟踪响应的智能信息助理软件和小程序将成为重要的智能技术应用趋势之一,新闻机构、娱乐公司、营销商、银行、地方政府机构等将会愈发广泛地通过智能信息助理传达重要信息。

  内容科技也将助力内容反馈的智能化,使内容生产者和运营者及时了解其生产内容的传播效果及传播路径,从而对生产、分发等各个环节进行调整,提升内容生产和运营效率,并为其维护版权利益提供依据。在大众传播时代,内容生产者在内容播发后,难以大规模、实时地收集用户的反馈,因而也难以将这些反馈用于指导后续工作,使内容生产难以走出单向传播、“精英生产”的思维误区。

  而在全媒体传播时代,“全员媒体”成为其最重要的特性。在互联网普遍赋能的背景下,传播过程由单向结构变成多向结构,受众转变为用户,开始能动地参与其中。当前,人脸识别、声纹识别、图像识别、数据挖掘等技术均被用于用户互动环节之中,移动终端用户的每一次内容消费行为都可以被实时记录下来,成为对其生产内容的反馈。内容生产机构或内容聚合平台可通过数据技术,对大量的用户反馈数据进行智能化分析,进一步指导后续的内容生产、分发等各环节。同时,用户的消费数据可能也伴随着新的数据内容(如转发、评论、点赞等)产生,这些内容也将回到采集环节,成为另一个循环的开始。

  首先,用于监测用户反馈的智能工具大大增强传播效果数据分析的颗粒度,从浏览量、评论量、转载量、点赞量、粉丝量等显性数据,逐步深入至用户个性化消费的行为、偏好、趋势等隐性数据,更准确地反映传播效果和用户个性。例如Netflix通过对用户诸如停顿、倒带或快进等收看行为、时段、地点、所登陆设备、搜索、浏览、滚动行为以及影片瞬间“屏幕截图”等数据的详尽记录与追踪,评估客户娱乐偏好以及观看模式,预测用户行为,为制作定制化的内容提供参考,使得准确定位目标客户,提高用户参与度变得更为容易。

  其次,用于监测内容反馈的智能工具可实现传播效果数据采集的场景化,从延时模糊到即时精确,从行为抓取到情绪识别,也极大地丰富了传播效果分析维度。2017年,哥伦比亚大学数据科学研究团队已经运用其研发的计算机视觉系统对美国总统特朗普的就职演讲进行分析,通过将其“微表情”与相应情绪进行快速配,挖掘和丰富现场的报道信息。因此,计算机视觉、情绪识别、情感计算等技术也有可能应用于识别用户“微表情”,建立实时情感识别系统,推测用户在信息接收与反馈时的情绪状态,完善用户实时状态这一关键的场景要素。

  首先,用于追踪传播路径的智能工具为内容生产、分发的进行式优化提供有效途径。前述的传播效果数据可以针对信息内容各要素形成度量指标和排名逻辑,谷歌的算法专利“用于改进新闻文章分级的系统和方法”,即将内容要素、新闻源要素相关的一系列指标纳入对在线内容进行排名的衡量体系中;那么,基于对传播路径的动态把握,则有可能进行逆向工程分析,指导信息生产和分发的优化路径。例如,根据用户的反馈数据,对信息内容的标题、体裁、语言风格、结构框架等进行调整;根据转载的路径数据,也将释放首发渠道、关键节点、多级传播关系等关于内容投放的重要信号,构建起实时流量分析系统,实现信息分发的路径优化。

  其次,用于追踪传播路径的智能工具也为强化信息核查、对抗虚假信息提供新型工具。“僵尸网络(malicious botnets)”即发送误导性内容的计算机网络,正在影响着网络信息的传播秩序,而利用人工智能技术可以进一步甄别恶意的社交机器人(social bots),识别信息内容的准确程度和动态变化,辅助内容核查。例如,通过对传播路径的溯源追查信息源头,通过跟踪分析发现信息传播与变异的关键节点,通过语义分析发现虚假信息的核心特征等,这些技术的应用将大大有助于虚假信息、水军数据的识别算法模型构建,构建起应对虚假信息的新型把关机制。

  [1]中国电子技术标准化研究院. 人工智能标准化白皮书(2018版)[EB/OL].

  [4]刁毅刚,陈旭管.“Xiaomingbot”背后,写稿机器人的技术探寻——专访北京大学计算机科学技术研究所万小军博士[J].中国传媒科技,2016(09):10-11.

  “内容科技”的快速发展赋能于数据和技术平台的掌控者,使他们对公众的价值判断以及对外部世界的认知方式,甚至对整个社会的意识形态形成产生了深刻的影响。环视生活日常,科技的双面性处处可感:人们在获得更广泛的信息时,也无形中接受了算法建构出的虚拟世界;精准推送升级信息消费体验的同时,也带来了个人数据权责不明,用户隐私泄露危机等问题。因此,从“内容科技”的长远发展出发,通过有效的内部监管和外部约束,使平台切实承担起相应的责任和义务,限制其权力的滥用,是必然手段。“科技向善”(Tech for Social Good)为“内容科技”提供了伦理基础。

  随着人工智能技术广泛渗透于人类社会的各个领域,“科技向善”的理念备受国内外关注。2018年5月,法国“科技向善”会议期间,Facebook、三星、德国思爱普、优步等科技公司共同讨论了科技创新带来的红利,以及社会规范、虚假新闻问题、个人隐私保护等对企业提出的新的要求。我国国务院副总理刘鹤在“2019中国国际智能产业博览会”上提出,“智能技术发展要以人民为中心,展现科技向善的力量,更好满足人类需要,努力提高人类福祉,要提高人类驾驭人工智能的能力,防范技术失控引发的各种风险。”2019年5月,马化腾宣布正式确定“科技向善”为腾讯公司的新的愿景和使命,要以“科技向善”引领人工智能全方位治理,提倡产品中的“人性”、科技的温度和善恶,倡导互联网企业能够主动提出和承担应尽的责任。

  马克思主义重要思想“科学技术是第一生产力”强调了科技发展是人类社会进步的不竭动力,因此,我们需要最大限度地运用人类的科技成果,通过“内容科技”来提升信息传播效率,改善用户信息消费体验。在此基础上,坚持“科技向善”,以人类社会的整体和长远利益为核心,让人们能够获取更加全面和真实的关于外部世界的信息。对此,在推动“内容科技”发展的过程中,需要着重解决以下问题。

  基于互联网连接的新型网络公共领域,在信息技术的不断更迭中,挑战了传统的社会秩序,继而对人们的意识形态和行为习惯产生了深远的影响。人工智能建构了数据化世界的理念,人类的自主判断越来越少,更加依附于算法的分析和预判,数据时代人们通过接收到的讯息所了解的世界,看似失去了传统媒体的“议程设置”,显得更加全面和广泛,却忽略了“内容科技”暗含的引导作用。

  对此,主流媒体平台不断尝试利用信息技术对人类价值形成的影响机制,探索如何将社会主流价值融入到个体意识的形成中,从而更好地形成社会共识。事实上,个人利益与社会公共利益是辩证统一的关系。个人利益是公共利益的基础和得以实现的前提,是构成社会有序进行的重要组成部分。公共利益则从根本上维护了个人权利,个人利益需要依靠公共利益来实现。当两者发生矛盾的时候,“适应性原则”应当作为平衡两者之间关系的重要准则,以保护公共利益为核心的前提下,实现个人利益的最大化。因此,对个人权利的适当约束,是为了更大范围和更加长远的社会利益的实现。而社会共识的形成,是网络空间秩序维护的重要保障。所以,个人自由的权利,包括选择权与表达权,同社会共识的形成和公共利益之间,可以实现平衡的状态。这种平衡,一方面基于对个人权利的合法合理约束,另一方面,应当保证在这一过程中,对用户数据及信息的保护,以及加大新闻重要性在内容算法中的权重,在发挥信息技术的优势同时,实现算法价值的修正,从而更好地形成社会公共价值,维护社会长治久安。

  在内容生产的不同环节中,都存在着“算法偏见”的问题,这更像是互联网时代编码与解码流程中的“刻板印象”,强调了在数据采集、加工和使用的过程中,计算机程序设计者所体现出的偏见倾向。算法在内容生产流程中的应用场景主要有:在新闻选题中作为新闻价值判断的中介;基于客观现实,通过算法映射和表征现实;内容互动产品中,通过算法实现程序修辞;内容推送中,基于算法进行用户监测与决策判断。

  常见的“算法偏见”类型主要表现为:第一,交互偏见,指机器在学习过程中,因为与用户产生的交互行为,而使算法产生的偏见。如聊天机器人在受到社群影响后所带有的种族或女性歧视观点等。这是现阶段由于算法本身的局限性所导致的偏见。第二,选择偏见,指在训练算法的数据被倾向性地用于某一个分组的时候,使该算法在应用的过程中存在群体偏见。第三,数据驱动偏见,指用来训练算法的数据存在一定的偏见。例如,在冷启动阶段,用户数据的采集主要基于用户注册账号时提交的基本信息,用户所在区域及使用设备情况,以及其它关联账号中所包含的数据。这使得原始数据的采集在一开始就存在着被曲解和圈层化的可能,致使在初期的内容精准分发中,体现了偏见的特征。第四,确认偏见,指程序设计人员受先入为主的信息及意识的影响,在处理收集到的用户信息的解构化过程和将分析、加工后的数据转换成信息的结构化过程中,都偏向于应用强化自身想法的数据,致使内容分发的结果存在很大的来自于程序员本身的意识倾向性。

  由于算法偏见导致的内容分发偏见,会带来用户接收内容的不断“窄化”,长此以往,“信息茧房”和“数字沟”问题也会随之加剧。机器算法的偏见,实际上体现的是人的偏见。解决这一问题的关键在于,对人工智能算法和系统进行有效地测试和验证,提升算法审计过程中的透明性,在内容生产和分发之前较早地识别偏见,修正算法,以保证内容的客观和多元。

  移动互联网、物联网的快速发展,传感器和存储器的广泛应用,使用户行为所产生的海量数据得以被抓取和存储,其中不仅包括了用户的性别、年龄、地理位置、社群关系等基本信息,也囊括了人脸、指纹、语音等个人生物体征信息。现阶段,平台对于用户行为数据的采集大多采取“能采则采,应采尽采”的原则,尽管平台对用户数据进行了一定程度的匿名和加密处理,但用户依然难以规避逐渐成为网络“透明人”的现实风险,和个人数据泄露造成的信息安全、人身安全、财产安全受损的严重后果。

  解决上述问题的关键在于,制定数据采集规则、明确数据采集维度,建立用户反馈机制,建构数据保护机制。2018年5月25日,正式生效的欧盟数据法《通用数据保护条例》规定,“数据采集公司不得在用户同意条件上含糊其辞,不得将同意指令与其他功能或事项进行捆绑。”该法案进一步明确了数据主体权力,指出“用户对个人数据拥有知情权、访问权、反对权、限制处理权等多种权利”,即用户对平台个人数据的采集路径、采集维度和采集目的有知情权,可以要求平台对非法采集或超出适用采集范围的个人数据进行删除或相应限制处理。

  该法案的实施性有待验证,但其提出的有关数据采集维度和个人数据权力的相关规定值得借鉴。对于哪些个人数据可以采集,应当遵循“非必须不采集”的适当原则,强化数据采集的主体利益和公共利益,通过细化数据采集流程,明确数据采集目的,以为用户提供优质的内容服务为根本宗旨,选择适量的、有价值的个人数据进行采集,并将相关规定和原则在“服务协议”中明确告知用户,事先获得用户的数据采集许可。同时,通过数据保护机制、数据泄露报告机制等构建用户数据的保护墙,从而更好地借助“内容科技”推动信息化社会的长远发展。

  数据使用过程中出现的主要伦理争议是数据的使用与归属问题,数据的使用维度与用户知情权,以及不当使用造成的个人信息和数据泄漏。

  用户行为产生的数据,其使用权和控制权并不在用户的手里,这其实是数据资本争夺所引发的伦理冲突。数据理应从属于用户自己,但用户因为缺少发表集体意见的机会和渠道,反而在数据归属权的问题上失去了话语权。平台往往通过用户服务协议签订的方式,将双方的义务和责任以及数据的相关使用权限设置其中,而人们为了使用平台的便利性,让渡了自己的隐私,对自身数据是否被搜集、利用甚至侵害则很少观察。解决这一问题的关键在于,完善相应的法律法规,明确规定平台产生的用户数据的归属权和决定权主体,以及在不影响用户使用的情况下,平台是否可以给予用户足够的管理权限,定期重新确权,从而保证用户数据使用的合规性。

  用户产生的哪些数据可以被使用和使用的维度,都是需要进一步明确的问题。基于大数据的个人需求预测和推荐可能在一定程度上暴露了用户的偏好特性或者对用户产生信息过载的困扰。用户数据的使用维度应当基于为用户提供更好的内容和服务,这需要对用户需求痛点的精准把握。同时,哪些数据可以被使用的前提是让用户享有真正的知情权,并获得用户数据的使用许可。当用户认为自己的利益被侵犯时,允许用户行使“遗忘权”,选择退订内容服务,并通过合法的流程要求平台删除相关的个人信息及数据。

  近年来,世界互联网发达国家均出现了大型的用户数据泄漏事件,造成了极其恶劣的影响。如2018年Facebook数据泄密,导致五千万用户数据被滥用,韩国网络实名制和德国《改进社交网络中的法律执行的法案》,最终都因大规模的个人信息和数据泄漏而被废除。个人数据泄漏的危害性表现为用户人身财产受到威胁,数据的非法使用裹挟用户思想,影响用户价值判断从而改变行为,如操纵政治选举。同时,个人信息的售卖会使企业造成巨大损失,甚至危及到国家信息安全。因此,平台应进一步加强网络安全保护,重视数据传输及存储安全,通过部署SSL证书等手段,降低网站数据泄漏风险,更好地保护用户的隐私权。

  2019年10月召开的党的十九届四中全会提出,要构建网上网下一体、内宣外宣联动的主流舆论格局,建立以内容建设为根本、先进技术为支撑、创新管理为保障的全媒体传播体系。“内容科技”不仅将成为内容产业向更广阔空间发展的引擎,更是推动国家治理体系和治理能力现代化的重要支撑。具体而言,内容科技的目标和任务有三个方面:

  内容科技将加速内容业态重构,催生新的社会化大分工。根据中国互联网络信息中心(CNNIC)发布的第44次《中国互联网络发展状况统计报告》,截至2019年6月,我国网民规模达8.54亿,较2018年底增长2598万,互联网普及率达61.2%。互联网等信息技术成为内容产业发展的最基本条件,随之而来的,5G、人工智能、云计算、大数据、区块链、VR/AR、物联网等不断发展为内容传播注入了活力,也对内容生产、分发、传播等环节带来了深刻影响,移动应用、社交媒体、问答社区、网络直播、聚合类平台、自媒体公号等新应用新业态不断涌现,在更广范围内推动着思想、文化、信息的传播和共享,媒体格局和舆论生态正在重塑。内容科技致力于将新技术应用到新闻产品的采集、生产、分发、反馈等环节,赋能媒体产业、社会创造力量、聚合分发平台以及各类内容触达终端,让内容安全可靠、有趣有用,让普通大众能够获得便捷的生产、传播工具,尽可能满足海量用户的个性化需求。

  1、内容采集高效便捷。传统媒体时代,数据的记录大多存储在本地,不作为公开数据资源,例如音乐、照片、视频、监控录像等影音资料,数量虽然巨大,但无法将其进行更深入的数据分析,社会对数据分析需求也不够强烈。而随着互联网的发展,大量数据开始共享到互联网上,特别是,移动互联网广泛应用后,多媒体数据、用户点击行为数据、用户位置数据、社交行为数据、交易数据等多元多样的数据涌现,越来越多行业对数据获取和分析的需求不断提升。美国市场咨询公司IDC研究报告显示,2018年全球数据总量为33ZB;预计到2025年,这个数字将上升至175ZB。技术的发展催生无限的数据,同时也赋能了我们更快速的数据采集能力。

  传统媒体时代,新闻工作者的需要带着大型的设备,到现场进行内容采集,拍摄完成后,需要回到办公室将内容拷贝上传至电脑上进行内容生产。但是随着技术的发展,内容采集工具正在一步步便捷、内容传输效率也在提高,尤其是伴随着5G的发展,5G技术“广接入”技术特性,将使人类的大数据采集能力发生革命性变化,在全面部署传感器并接入5G 网络的基础上,全程、全息采集数据。在技术的加持下,利用传感器采集新闻将得到进一步发展。清华大学教授彭兰认为“所谓传感器新闻是基于传感器进行信息采集、以数据处理技术为支撑的新的新闻生产模式。”人的感官是有限的,所能听到、看到的事物一定会有限度。而传感器就是作为人感官的延伸。它可以代替人的眼睛、耳朵去看、去听人看不到的内容,同时它的广度、深度、精准度都将无限超越人类。所以利用传感器可以拓宽内容采集的维度,采集到人所无法涉及的内容。2015年10月,央视推出的“数说命运共同体”专题中,5位数据分析员用了21天分析从GPS系统获得的“全球30万艘大型货船轨迹”,他们发现,过去一年里,途经“一带一路”沿线主要国家的海上货运量增加14.6%,而同期全球航运总量只增加3.8%。对于这个专题中核心数据的挖掘来说,GPS系统至关重要,而GPS系统就是一种与地理位置相关的传感系统。

  2、内容生产有用有趣。随着人工智能、大数据、云计算、5G等技术的应用,内容生产环节发生了前所未有的改变,机器人写作等正在成为趋势,“人机协作”将是未来新闻生产的主要方式。例如,从2006年起,中国和美国媒体都在研发机器人写作,已经应用于股票价格、体育统计、天气预报、财务报告等领域。媒体行业对AI的期待是提高效率,将记者从基础工作中解放出来,让他们完成更复杂的选题,讲述只有人能讲述的故事。全媒体时代,我们不仅能够运用音视频、动画动漫等各类表达方式,还产生了VR新闻、移动短视频、H5交互式新闻、无人机新闻等全媒体的表达手段。新闻生产从“可知”迈入了更具丰富性的“可感”。智慧媒体时代,一个重点就是营造身临其境、参与其中的“可在”,实现“有我”的在场感。数据新闻是在大数据时代兴起的另一种新闻生产方式。关于数据新闻的定义众多,但都包含两个方面,一是数据新闻内容上是它基于对碎片化的数据进行挖掘、抓取、统计、分析来发现新闻线索;二是通过文本、图表、图形、色彩等可视化技术将新闻内容呈现出来,增加了内容的趣味性和视觉冲击力。

  3、聚合社会创作力量。技术降低了内容生产门槛,使内容传播主体更加多样,观点更加多元,每个人都可以成为信息的接收者和发布者。但自媒体人素质高低不一,对内容的把握能力有限,导致有害信息发布频率变高。同时,自媒体传播内容目前主要是个人或者自媒体机构依托平台对外发布。传播信息由自媒体人或者机构自行决定,没有统一的内容标准,也没有严格且有效的审核机制。而且从平台审核情况看,部分自媒体利用图片发布有害信息,平台在审核过程中难以捕捉。内容质量鱼龙混杂、版权保护意识不足、推广运营机制模糊,导致优质创作者无法得到快速发展。内容科技的发展,能够构建社会创作力量集合平台,将社会化内容生产的源头——“人”汇聚在一起,通过政策引导、创作指导、创作赋能与商业赋能等,驱动社会创作力量的内容生产导向正确、高效便捷。人民网自主研发了“人民智作”平台,采用“汇聚人”的模式,提供运管服务。平台集聚人民网自有资源及党政、媒体、渠道、产学研用等资源,为社会创作力量提供选题参考、热点搜集、素材资源、创作工具、渠道传播、运营培训、内容创业等于一体的服务。通过平台对聚合资源的集约化整合融通,为社会创作力量输送个性化的资源服务,助力社会创作力量智能化写作,引导社会创作力量规范创作和有序发展,使创作者能在各个平台上更安全、更高效、更便捷地生产内容,为平台的全体参与者创造价值、共享收获,以优质的内容聚合构建网络生态。

  4、精准分发优质内容。互联网时代,面对海量数据,如何选择自己需要的内容是每个用户面临的问题。互联网发展初期,谷歌、百度等通过搜索引擎的方式让用户搜索自己需要的数据。传统的搜索技术是一个相对简单的基于关键词的帮助人们找到信息的工具,搜索引擎虽然被人们广泛使用,但并不能解决信息过载这一信息时代的核心问题,原因在于某些陌生领域,用户很难用恰当的关键词描述自己的需求。而随着人工智能等技术的发展,催生了内容精准分发,即根据用户的历史数据主动推荐给用户满足他们兴趣和需求的信息。每个人的需求是不同的,内容的精准分发尊重个体,相信每个人都是与众不同的。在这个以“人”为中心的社会化时代,精准分发得到广泛发展。人民网以大数据、人工智能技术为核心,搭建了智慧聚发平台,平台聚合全国媒体的优质内容资源,通过对各类内容形态的数据进行聚合分类、清洗过滤、脱敏、标签识别、内容安全识别、内容质量评价等系统化处理,形成标准数据。再依据用户画像系统,按阅读偏好、消费能力等个性画像,将优质内容精准推送出去,全面提高内容产业从创作源头到消费场景全链条运营效率。

  5、全面接收用户反馈。传播学界对于传播效果的早期研究主要是从传播者或传媒的角度出发,考察传媒是否达到了预期目的或者对受众产生了什么影响。传播学“使用与满足”理论指出,传播学研究不应当仅仅关注“媒体对人们做了什么”,还应该仔细研究“人们对媒体做了什么”。“使用与满足”研究凸显了受众本位,是传播学研究从“传者导向”向“受者导向”视角转折的重要标志。

  媒体行业发展初期,主流媒体是新闻的把关人,受众处于新闻传播的最末端,受众基本以电话、写信的形式反馈,反馈较少且不及时。随着互联网的发展,受众的反馈开始增多,参与甚至主导内容的发展。随着新技术的发展,受众的主动性不断增加,在传播过程中的主体地位迅速提升,面对丰富多样的传播媒介、信息内容、获取终端等,用户掌握了选择权和主动权。用户对内容形式和质量的期待也在不断提升,只有了解用户,才能更好的进行内容生产。

  美国著名视频网站Netflix通过计算并处理3000万次用户体验、400万条用户评价、300万次用户搜索操作及用户观看视频的时间和使用终端等数据,分析用户信息及其观看习惯,发现有很多观众喜欢BBC老版的《纸牌屋》,因此,决定翻拍该片。通过数据分析,Netflix还发现喜欢观看1990版《纸牌屋》的影迷们同时喜欢看导演David Fincher的作品和奥斯卡影帝Kevin Spacey的作品。因此,新版《纸牌屋》邀请了David Fincher(制作人)和Kevin Spacey(男主演)加盟这部作品的翻拍。事实证明,Netflix翻拍《纸牌屋》大获成功,借助于这部剧的热播,其订户数成功超越了传统的HBO电视网。

  今日头条是一款基于大数据分析计算模式进行个性化推送的资讯类App。其本身不生产新闻,而是聚合整理各大平台的热点内容,并基于个性化推荐引擎技术,根据每个用户的兴趣、位置等多个维度进行个性化推荐,帮助用户在海量的信息中寻找感兴趣的话题新闻。“今日头条”会在用户使用过程中监控用户点击、评论、转发等相关行为,并根据用户相关的阅读行为、阅读兴趣等建立用户个人模型,为用户进行精准的“个性化推荐”。

  6、增强国际传播能力。党的十八大以来,习总书记对外宣工作的发展十分关注,曾多次发表重要讲话,提出“讲好中国故事”“打造外宣旗舰媒体”。党的十九大报告指出,推进国际传播能力建设,讲好中国故事,展现真实、立体、全面的中国,提高文化软实力。回顾人类历史上国际传播的每一次飞跃,事实上都建立在技术革新的基础上,要借助虚拟现实、增强现实、人工智能等内容科技及其催生的新应用,突破国际传播中语言、时空、跨文化的阻碍,丰富国际传播场景,传播中国声音。例如,在5G技术的加持下,VR、AR技术将得到进一步的提升。在实践中,主流媒体可以利用虚拟现实技术设置内容丰富的不同地区、城市、乡村的新闻或文化场景,以情节曲折、富有吸引力的故事形式呈现给国际受众,让国外受众主动“走进故事”、体验场景,从而形成共鸣、共情和好感。要综合运用各种对外传播载体,创作各类适合新媒体平台传播的内容和产品,根据渠道特点和受众接收习惯展开全媒体传播。

  随着5G、AI、IoT技术逐步普及和场景化应用,内容传播出口无处不在,无时不在。以技术为驱动,以物品为载体的全新国际传播模式已向我们走来,而通过中国制造搭载全球各国本地化、场景化的精品内容的传播方式必将焕发勃勃生机。内容科技将通过中国智造引导全球资源,构建全场景、全联接、全产业的全球价值内容生态圈,增进国与国之间的民心相通。

  《有限和无限的游戏》一书写到,世界上有两种游戏,一种叫有限的游戏,一种叫无限的游戏。有限的游戏以取胜为目的,无限的游戏以延续游戏为目的。内容科技就是一场无限游戏,内容行业如果仅在领域内纵向发展,其价值终将有限。借助科技的力量,以内容为介质,同其他产业进行横向关联、广泛融合,催生出全新的内容产业,其价值将会无限放大,从有限走向无限。

  随着人工智能、大数据等技术的发展,智能技术深入到社会的方方面面,改变传统制造业,改变服务业,改变教育、医疗,所有产业因为数据、计算而改变。而对于产业来说,产业的竞争力也不在于其本身,而是产业背后的服务和体验,未来各行各业都将变为服务业。例如新制造,工业时代和信息时代让制造业自动化、规模化、标准化,而数据时代,制造业是个性化、智能化。流水线上的大部分工人将会被机器取代,但人类体验的部分,不可能被取代。因此,各行各业都将向服务转型,而无微不至的服务都需要数据、内容提供支撑。

  随着云计算、大数据、人工智能等技术进一步的发展,内容产业正在走向“内容即服务(CaaS)”,企业不需要搭建自己的内容运营系统和数据能力,CaaS可以便捷、精准为企业提供内容服务。内容科技的目标就是用科技“横向”打通内容产业与其他产业。内容不仅是一条纵向的产业链,而是成为一项生产要素,成为其他产业的赋能者。

  1、内容赋能制造业,助推中国制造迈向“中国智造”。毛绒玩具、手机、音箱等本身只是一个载体,但是在内容的加持下,它的服务得到升级,用户体验更好,产业取得快速增长,这就是内容产业赋予制造业的价值。随着5G、AI、IoT技术逐步普及和场景化应用,内容与人、机、物的全效能、全场景链接,赋能中国制造迈向“中国智造”将成为趋势。人民网自主研发的智慧聚发平台,让中国制造的各类产品在出厂时可以搭载全球各国的精品内容,在不同国家的售卖渠道上进行本地化传播,伴随中国制造的全球化销售实现全球内容的精准分发和触达,构建中国制造“5G+AI+IoT”全球融媒生态。而音箱、手机等智能硬件也可以在传播内容的同时收集用户数据,反哺内容产业,构建内容生态圈。

  2、内容赋能服务业,促进服务业态创新。根据2018年国家统计局发布的《国民经济行业分类》,服务业即第三产业包括批发和零售业、交通运输、仓储和邮政业、金融业、房地产业、文化、体育和娱乐业等。国家发展改革委发布的《服务业创新发展大纲(2017—2025年)》提出,鼓励利用新一代信息技术改造提升服务业,创新要素配置方式,推动服务产品数字化、个性化、多样化,推动服务网络化、智慧化、平台化。服务业的数字化转型离不开信息、离不开内容,内容赋能服务转型是大势所趋。人民网自主研发的智慧聚发平台,依托自有的智媒聚发、智能创作、全媒体池、用户画像和商业运营等功能系统,构筑内容版权矩阵,能够面向 B端、G端等各类内容需求场景提供精准的精品内容分发及运营服务,可以精准地为金融业提供财经内容,为旅游业提供文旅相关内容,提高用户使用相关服务的时长和活跃度,增强服务粘性,延伸服务行业的上下游。内容+服务必将成为服务业转型升级的新业态。

  3、打造智能化内容平台,为各行业提供知识图谱服务。内容科技的目标是建设一个全媒体智能平台,依靠人工智能等技术,使信息内容、技术应用、平台终端和管理手段共融互通,满足全程媒体、全息媒体、全员媒体、全效媒体的需要。智能化内容平台将建立一套对常规音视图文数据进行知识生产、管理、利用、服务的体系,可以提供音、图文、视频等多模态的内容资源以及提供专业知识服务应用,以知识为基础,通过知识获取、知识验证、知识表示、推论、解释等核心环节,改造现有内容平台基础框架,全面提升内容为媒体行业及其它行业服务的能力和效率,让内容成为各行各业场景应用的“盐”,为实现媒体行业与各行业“横向”融合提供基础平台。

  (三)在生产、聚合、分发、用户参与、底层数据等环节有效服务于党管意识形态

  意识形态是系统地反映社会经济形态、政治制度和文化模式的思想体系。做好意识形态工作,事关党的前途命运,事关国家长治久安,事关民族凝聚力和向心力。内容科技以主流意识形态引导和社会共识达成为重要指向。在数据成为国家间竞争核心战略资源的信息时代,内容科技要支撑从“党管媒体”拓展到“党管数据”,更加直接、深度、精准地把握社情民意的走向,成为治国理政、改善民生、团结群众的重要手段。在以互联网为代表的信息技术革命潮流中,前端应用和主体日益多元化,呈现出去中心化、个性化等特征,但实际在后台形成了集中化的平台,形成了新的中心。集中化成为去中心化、个性化的基础。从战略高度把握基础性和关键性技术应用,增强对内容中后台的把控能力,成为内容科技的重要使命。要在集中审核管理的基础上,汇聚内容生产、聚合、分发、用户参与等各环节底层数据资源,为社会提供大规模个性化服务,成为全媒体传播体系的枢纽和闸门,形成前端去中心化、后台集中化相统一的现代传播体系,再造传播体系新中心。

  1、建立内容审核与风控管理平台。针对前端内容形态多样、传播者众多,亟需强大后台技术支撑的情况,应该以主流媒体为中心搭建内容审核与风控管理平台,使“内容生产大脑”与“风控大脑”相辅相成,为各网站、移动客户端、社交媒体平台以及区块链等新型传播平台提供内容管理服务。通过多源异构数据的深度学习和图像分析、语义理解、情绪分析等,实现主流媒体内容审核与风控管理经验与能力的社会化分享,提高全社会全媒体内容风险管控能力,确保国家政治安全和文化安全。

  2、建立舆情大数据分析与研判系统。在内容风控管理平台的基础上,媒体可对已发布和未审核通过的文字、图片、视频、音频进行全内容、全要素分析,综合应用传感器、通信技术、定位技术、高通量计算技术,借助5G的超高传输速率,采用分布式云存储,实现在任意时间访问和分析数据,增强对网络舆情风险的全面感知能力,提升舆情智能研判水平,为舆情应对、议程设置提供科学支撑。

  3、加强内容后台技术标准制定和数据共享。由相关部门牵头制定统一的技术标准和规范,研发统一的内容标签库以及核心算法,构建大规模跨平台的海量敏感数据特征库、特定用户名库、社交关系库等,挖掘面向智能化内容审核的知识图谱,使分散的内容审核和舆情研判等中后台能够互联互通,形成对社会整体的意识形态风险感知和应对能力,为信息传播影响力的最大化或信息传播的高效阻塞提供技术方案。

  作为中国网络媒体的先行者,新浪一直致力于为全球华人提供及时丰富的内容服务,历经多年发展,目前已形成以新浪微博为核心的社交媒体平台,和以新浪新闻为核心的智能媒体平台。其中,新浪智能媒体平台由新浪新闻APP、手机新浪网等媒体矩阵组成。截至2019年11月,新浪新闻月度生态流量已达4.4亿。2016年以来,新浪新闻持续发力“智能化”布局,依托科技和数据赋能,实现了人工智能在媒体平台“采编审播”全链路的融合应用,由传统门户网站成功转型成为智能媒体平台,成为国内智媒平台建设的标杆案例。

  在新浪智能媒体平台上,人工智能技术应用贯穿采集、编辑、审核、分发全链路。

  在智能采集方面,2016年起新浪率先探索AI赋能信息采集,对重要媒体、网站、榜单等信息源进行智能“聚合”。2016-2017年,90%以上的热点发酵于微博,新浪基于微博数据进行热点传播算法建模,打造基于社交化平台的“线年至今,新浪探索深度学习技术,打造更完善的热点线索“知识图谱”。针对时效性及非时效性热点,提炼颗粒度更细的分析模型。基于大数据实现模型的不断训练,增强线索捕获上的泛化能力,实现更多新增热点的“自主”发现。

  在智能编辑方面,新浪新闻APP 2016年起开始通过“大数据+AI”为媒体编辑赋能,2017年已实现了赛事新闻和财经快讯等新闻的自动化生成。近两年新浪新闻逐步实现了AI辅助生成专题。高品质专题离不开编辑的策划与构思,机器可通过深度学习技术挖掘热点专题规律,为编辑提供自动化聚合的结构化分析建议,再将内容按照时间顺序或热度聚合,并通过NLP以及图像识别等技术进一步排重,有效辅助编辑根据策划思路快速搭建热点专题,高效辅助编辑完成热点专题工作。

  在辅助审核方面,早期新浪新闻审核环节主要基于传统机器学习完成,包括传统图像识别算法、传统的语音识别算法及传统NLP算法。2017年起,新浪新闻APP与中科院等机构和企业展开合作,运用端到端的深度学习技术完成对敏感信息、有害信息的识别和标注,大幅缩减了审核时间成本,提升了审核效率。

  在提效分发方面,2017年起,新浪新闻APP开始探索利用深度学习技术实现更精准的兴趣分发,将知识图谱和用户行为数据相结合,提升社交平台的传播效率,让内容更准、更好地触达用户。同时通过多平台数据分析用户内容消费习惯,把握需求动向,调整推荐服务方向,提升推荐分发效率。

  在运用人工智能技术赋能采编审分发全链路的探索中,新浪在热点发现领域积累的优势非常显著。依托新浪20余年沉淀的内容数据和微博10年来开放的社交媒体数据,新浪集成了业内领先的热点线索供给“资源池”,以及包含百余种典型事件传播模型的“知识图谱”。

  其中最具代表性的就是新浪独有的“鹰眼”线索采集系统——以微博、新浪网内容为核心,结合全网头部信息,采用大数据、实时计算、机器学习等技术,结合编辑、运营、自媒体、销售业务等场景和需求,辅助及时发现全网/领域/衍生/创造热点,开展热点专题聚合、热点传播、热点分析及过程实时监控,支持运营挖掘优质精品内容。新浪在“AI+人工”双轮驱动的信息采集流程中,实现了显著提效。其中,文章线索收集工作效率较鹰眼上线倍;辅助重大热点事件运营数量同比增长155%。

  随着新浪新闻持续发力“智能化”布局的不断推进,新浪智能媒体平台内容、服务对用户的吸引力不断增强,其智能化成效显著。

  首先,智媒转型举措有力促进了用户可阅读资讯的极大丰富。新浪新闻APP运用机器深度学习与实时计算帮助内容运营团队尽早发现潜在新闻热点并利用“大数据+AI”为媒体编辑赋能,使内容以前所未有的数量和速度被生产和消费。2019年11月,新浪新闻APP用户可阅读资讯量较去年同期增长了35.7%,人均刷新次数较去年同期增长12.6%,人均视频播放量较去年同期增长28.8%。

  第二,分发效率大幅提升。凭借对技术红利的前瞻掌握与应用,新浪新闻APP在开放知识图谱上进行相关内容推荐、商业推荐,基于用户兴趣,基于大数据标签体系实现精准分发,分发效率进一步提升。以PUSH为例,2019年11月,PUSH内容的点开率较去年同期增长27.9%。

  第三,推荐更加精准,阅读时长提升。在大数据支撑下,新浪新闻APP通过用户即时兴趣、动态化场景、网状知识图谱和社交关系等实现了高度匹配和精准分发,用户使用时长大幅提升。2019年11月,新浪新闻APP人均单日使用时长较去年同期提升了22.4%。

  第四,MAU、DAU大幅提升。截至2019年11月,新浪新闻APP的DAU超过4280万,同比增长29.1%,MAU破亿,同比增长15%,这两项数据较智能化以前(2015年)上涨接近10倍,人工智能成为拉动新浪新闻用户增长的核心驱动力。

  深耕内容行业二十余年,新浪新闻一直是国内公认的互联网媒体领导者,其有责任、也有能力代表行业持续进行创新。在智媒平台转型上,新浪基于其在内容数据、社交媒体数据及AI领域得天独厚的优势,率先实现了内容生产全流程的“智能化。