人工智能在短视频领域中的应用趋势
朱 琦
(北京芦墨科技有限公司, 北京 100020)
摘 要:随着人工智能技术的提升,其在短视频领域的应用也愈发广泛。本文着眼于人工智能在短视频领域内对创作者、平台、用户三方的影响,分析了人工智能的应用是如何辅助了创作者内容生产,提高了平台的分发效率,并优化了用户体验,对短视频领域的发展起到助力。
关键词:人工智能;短视频;新媒体传播;内容生产;分发 中图分类号:G206 文献标识码:A文章编号:1671-0134(2020)12-044-03 DOI:10.19483/j.cnki.11-4653/n.2020.12.009本文著录格式:朱琦.人工智能在短视频领域中的应用趋势[J].中国传媒科技,2020(12):44-46.
随着移动互联网的迅速发展,短视频迎来了爆发式的增长。短视频是指依托于互联网新媒体传播的短片视频。不论是从用户数量还是使用时长上,短视频都在以极快的速度增长。2020年初,抖音的日活突破了4亿,快手的日活也突破了3亿。与图文内容相比,短视频的形式有更高的互动性、内容更加丰富多元,也获得了很高的用户黏性。随着5G时代的到来,可以预见的是短视频将会更为普及。与此同时,短视频的创作和分发也面临很多新的挑战。而人工智能作为近年来发展极快、普及度极高的一项技术,在短视频领域的应用也越来越多。本文将探讨人工智能在短视频领域的一些应用趋势,相信有效地应用人工智能技术,必将为短视频行业带来极大的发展。
1.人工智能技术发展现状
将人工智能应用到短视频上的重要前提之一是人工智能有能力进行准确的图片和语音的识别。此前,人工智能在新媒体中的主要运用是图文创作和图文内容分发的智能化推荐。从文本分析到图片分析,对人工智能来说非常重要的一大步。由于图片识别难以依赖于既定的一系列规则进行判定,而是需要系统通过机器学习和深度学习对大量照片进行学习,以逐步提高判断的准确率,这对于机器学习的模型有很高的要求。
[1]
2.人工智能在短视频领域中的应用2.1 辅助创作者内容生产2.1.1 根据图文内容生成短视频
很多图文创作者都面临向短视频转型的挑战。与图文创作相比,短视频的创作门槛更高,需要收集或创作大量的图片素材,加入配音和背景音乐,并进行后期剪辑。传统的图文创作团队往往缺乏所需的技能或人力。随着人工智能技术的提升,人工智能已经可以自动将图文内容转化为短视频,这将极大提升短视频领域的内容生产效率。
国内最初开始使用人工智能机器人写作就是在新闻领域。自2015年,腾讯旗下推出了财经频道有机器人Dreamwrite,新华社旗下有写稿机器人“快笔小新”,今日头条也发布了写作机器人“xiaomingbot”。[2]这些机器人大多被用于撰写财报、快讯,、和简单的新闻稿,助力媒体即时发布新闻。
当用户习惯转向短视频后,人工智能视频生成工具也率先被应用到了新闻领域。[3]2020年4月,百度研究院发布了一个名为VidPress的AI视频生成工具。仅需要粘贴一个新闻图文内容的链接,VidPress平台就会自动收集整合事件相关素材、用算法根据兴趣点对视频素材进行排序、生成解说词、合成语音,直至对齐音轨并渲染导出,全部自动化生成视频的步骤在9分钟内就可以完成。
百度VidPress已投入实践应用,开始通过其API接口为好看视频大规模生产内容。根据好看视频数据,目前VidPress生成符合其平台要求的视频所需时长的中位数仅为2.5分钟,每天可以生产500到1000条视频。更重要的是,VidPress平台还可以自动发现热点,从选材到最终的视频生成的整个过程都可以做到完全无人化、自动化,因此可以做到24小时不间断地播报新闻。2.1.2 对长视频进行二次剪辑
短视频为创作者提供了对影视和综艺作品等进行再理解和再创作的机会。因此,创作短视频作品不一定需要原创素材,也可以对已成型的长视频作品进行二次剪
在过去几年中,人工智能在图片识别方面发生了许多技术上的突破,涌现出了许多优秀的深度学习模型,例如无监督机器学习的生成对抗网络(GAN)。国内外的许多互联网公司也都开发了属于自己的人工智能图片识别平台,例如亚马逊的Amazon Rekognition、微软的Microsoft Computer Vision、谷歌的Google Cloud Vision、IBM Watson的Visual Recognition、百度AI开放平台的图像识别等。随着识别能力的提升,人工智能开始被逐渐投入到实践中,被用于图片和视频内容的生成、审核、和分发。而字节跳动旗下强调以人工智能驱动的短视频平台抖音和Tiktok在海内外的广受欢迎,也说明了人工智能在短视频领域有成功应用和发展前景。
辑。例如,电影解析就是一类在短视频平台上广受欢迎的二次剪辑作品。创作者在短短几分钟内就可以将两个小时的电影情节和精华部分向观众阐述清楚,帮助观众节省了大量甄别和观看的时间。而人工智能技术的应用则让二次剪辑变得更加简便,也为二次剪辑最终呈现的效果探索出了更多可能性。
在哔哩哔哩上,有两大名为“电视剧Cut”和“综艺Cut”的作品分类就属于二次剪辑的范畴。“Cut”即为围绕喜欢的人物进行再剪辑。Up主只会剪出自己欣赏人物的相关剧情和高光镜头,让剧集视频长度大幅减少。在这个各种电影、电视剧、网剧、综艺层出不同的时代,观众从时间分配上难以追完所有的热点影视作品,因此也乐于摒弃分支剧情,只关注自己感兴趣的角色的发展。随着人工智能技术的提升,现在许多二次剪辑已经可以自动化生成。在腾讯视频和爱奇艺视频等流媒体平台上,通过AI人脸识别技术,已经实现了“只看TA”的功能,让观众可以只看自己喜欢的角色出现的部分,实现高效追剧或综艺。
同样用到二次剪辑的还有电影预告片的生产。为了对作品进行预热,电影制作方往往会提前剪出1至3分钟的预告片,用短视频形式进行大范围传播。早在2016年时,21世纪福克斯和IBM就使用Watson系统为惊悚片《摩根》自动生成了6分钟的预告片。[4]在2019年的财报中,Netflix也透露正在计划利用AI大批量为其旗下影视内容生成预告片。人工智能可以基于人脸识别、物体识别、视频内容理解等功能对电影内容进行解析和理解,自动剪切和精选视频素材,并最终生成预告片。利用人工智能生成预告片将有三大优势:第一,人工智能节省了大量的人力物力,降低了剪辑师的人力成本;第二,人工智能可以通过对大量同类型的预告片进行分析,挖掘出最受观众喜欢的创作模式;第三,人工智能可以根据用户喜好进行个人化定制,做出千人千面的预告片,让每个观众都看到自己最喜爱的内容,吸引更多人去观看正片。2.1.3 多种特效降低创作门槛
人人都可以观看短视频,但是要创作短视频还有着许多挑战,涉及构思、布景、打光、拍摄、配音、剪辑等多个环节,需要掌握多种技能。而短视频平台的特效功能则可以有效地降低创作门槛,让更多人可以通过使用特效,轻松参与短视频到创作中。而特效要和所拍摄人物的有效地结合一起必须要用人工智能对拍摄者的脸部和身体达到准确的识别效果。
其中,抖音在今日头条的AI Lab的支持下,就推出了多款由人工智能支持的爆款特效,让创作者可以依靠特效做出有强烈视觉冲击力和互动性的作品,并激发出新的创作灵感。
2017年,抖音推出了“尬舞机”功能。尬舞机是一个体感游戏,用户需要按照屏幕中的指示动作,在对应节拍摆出对应的动作,并根据准确度得到游戏分数。每局游戏的过程都会被抖音录制下来并作为视频发布。通过基于
新媒体研究45
人工智能的“人体关键点检测技术”,抖音可以在复杂的衣着和背景环境中,精准地识别人体的姿势动作,并和目标姿态进行对比和匹配。同年,抖音推出了“实时染发”特效,用户通过在手机上点选不同的发色,可以实时改变视频中自己的头发颜色,模拟现实中的染发效果。为了实现这项功能,抖音使用人工智能技术对头发区域做了精细的识别,在边缘处进行自然的分割,预估其反射率,渲染出高度贴近现实效果的颜色。2020年6月,抖音的新特效“变身动漫”让用户可以通过挥手将自己在视频中的形象转别为二次元动漫风格,从五官、脸型、发型、衣着,都可以实时转换。使用自研的推理引擎ByteNN并在嫁接了不同的深度学习模型后,做到了千人千面的人脸实时动漫效果。这些特效都帮助创作者在不用过多考虑形式和内容的情况下轻松创造出有趣的作品。2.2 提高平台的分发效率 2.2.1 实现短视频的个性化推荐
依托人工智能,短视频平台可建立用户和内容之间的匹配机制,为用户提供进行个性化推荐,提升分发效率。要精准匹配用户和内容,人工智能首先需要对用户和内容建立了解。用户方面,人工智能会收集用户的行为数据,分析用户习惯、描绘用户画像和用户兴趣图谱,通过用户在观看短视频中的页面停留时长、播放完成度、是否点赞、是否评论、是否分享、是否快进、是否有拖拽行为、是否重复观看等行为来衡量用户对该视频的偏好程度。内容方面,人工智能会对视频进行识别和分析,根据短视频标题、简介、封面图、视频帧等部分提取特征生成标签。然后,平台会将内容的标签和用户的兴趣进行一一对应,先将视频分发给小批量目标用户收集用户反馈,再根据系统评分衡量是否要推广给更广受众。2.2.2 更完善的内容审核制度
随着短视频行业的极速增长,短视频平台拥有了更大的社会影响力,也对平台上的内容有了更大的监管责任,需要保证输出内容的健康性。对于UGC(用户生产内容)平台,审核往往需要耗费大量人力,而视频的审核则比图文内容更加复杂。抖音在2018年就宣称计划将6000人的审核运营团队扩充到10000人,但是随着平台的发展,现在每天已有超过4500万条视频上传,平台体量必将超过人力可以审核的范畴。
人工智能审核的优势则在于可以迅速处理大量的数据,配合相应机器学习模型,可以准确识别视频内容并作出判断。运用人工智能,平台则可以训练系统自动鉴定色情暴力、政治敏感、低俗恶意、黑产推广等违禁内容。在训练系统的过程中,首先会输入大量带有对应标签的训练数据,让系统“学会”违规图片的特征。这样当输入新视频时,系统就可以自动提取相应特征,并结合学习的经验判断该视频违规的概率。如果最终判定违规概率高于一定阈值,视频就会被归为敏感素材,进入人工审核环节,由审核师抽取其中的画面和关键帧来判断是
46新媒体研究
否确实存在违规。通过这样的流程进行分类筛选,可以在控制人工成本的同时有效降低违规视频的出现概率。
但是在当前的技术下,人工智能还很难独立完成全部的审核任务。因为短视频中的内容非常多元和丰富,机器学习的训练素材无法完全囊括。而且在许多情况下,并没有通用的统一标准可以一刀切地判断视频内容是否符合价值观,所以必须加入审核团队的主观判断。 例如,2018年3月,快手上的大量“未成年妈妈”的分享被央视点名批评。要杜绝此类内容并不是靠机器可以做到的,而是需要平台对舆情敏感,持续跟进政策动向,并将引导用户形成正确的价值观作为公司的核心目标。因此,目前的视频审核通常需要将人工审核与人工智能审核结合起来。
2.3 优化用户体验2.3.1 根据喜好进行推荐
如抖音这样的短视频平台用户日活已超过4亿,平均日播放量达到600亿。在这样海量内容的平台上,对用户来说,要找到自己喜欢的内容是非常困难的。尽管视频内容会根据主题分成许多标签,但是不同用户对视频的风格、内容、节奏等喜好有很大差异,就算在一个感兴趣的主题标签下进行浏览,仍可能收到许多负面反馈,看到很多自己并不喜欢的视频。人工智能则可以以极细的颗粒度收集用户的行为数据,分析出用户可能自己都没有意识到的观看习惯,针对用户的喜好不断地为他们提供所喜欢的内容。例如,一位用户可能缺乏耐心,只有在开始前十秒就抛出亮点的视频才能吸引住她,她很难通过搜索找到拥有这一特质的作品,但是系统却可以在自动识别她的偏好后为她大量推送同类作品。而作为用户,当在一个平台上看到的短视频内容都是自己感兴趣的、认同的,就会和该平台建立起积极的感情链接,产生喜爱和信任感,在使用产品时的认同感以及观看体验都会大幅提升。2.3.2 根据喜好进行拓展
人工智能不仅能准确地为用户推送他们喜欢的内容,还可以通过深度学习预测他们可能会喜欢的内容。用户不需花费大量时间去做主动的搜索,系统将自动根据相同爱好相似背景的人,帮助用户扩展自己的边界,了解更多可能感兴趣的关联信息。人工智能的试错成本较低,而且可以从错误中进行学习,迅速定位到用户潜在的喜好,为用户带来更加自由多元的体验,帮助用户获取新知识和新鲜感。
3.人工智能在短视频领域中的限制3.1 隐私
人工智能需要收集大量数据,并对其进行管理、分析,才能从中挖掘出洞察。可用的数据量越大,人工智能的判断就越准确,服务就更便利。因此系统会倾向收集用户尽可能多的行为数据。但是如何界定哪些信息是可以收集的,哪些是用户的个人隐私,则没有一条明确的规范。3.2 偏见
因为大多短视频平台系统的逻辑是挑选最能第一时间吸引用户注意力的内容进行推广,这必然会放大人的“本能”部分,只提供较单一视角的信息并进行夸大,强调戏剧性而牺牲深度。[5]而由于人工智能根据算法会优先推荐用户喜欢的内容,这将进一步导致“信息茧房”的产生。随着短视频平台的用户黏性越来越高,人工智能可学习的数据越来越多,将来平台方可以使用人工智能来预测用户的下一步行为,并由此开始从偏见的强化者逐渐变成偏见的创造者:在用户接触到一个新领域或新事件之前就平台就可以预知他会更偏爱什么样的观点,并提前准备好只推送支持该观点的内容。3.3 伪造
使用人工智能的人体图像合成技术,人们可以合成出看起来非常真实的换脸视频和图像。这种技术被称为Deepfake,是由深度学习(Deep Learning)和伪造(Fake)造出的混合词。Deepfake带来的危害显而易见,用户可能会假冒他人身份,甚至制作名人出镜的假视频,侵害他人权益。因此平台需要加强检测视频的真实性。2020年9月,微软上线了一种新的视频检验工具Microsoft Video Authenticator,该工具可检测照片和视频,并得出一个其可能被人为篡改过的百分比,意在打击Deepfake在网络上的传播。结语
短视频行业正在蓬勃发展,迅速成为大众泛娱乐生活中重要的一个版块,因此也成了新媒体传播中一个值得深入研究的方向。其中,人工智能领域的技术突破为短视频的发展提供了很大的助力,既为平台提供了多种工具,也改变了人们的交互体验,吸引更多人加入短视频的创作和观看中。相信在未来的发展中,人工智能技术必将更加发达和普及,在短视频领域有更多样和更广泛的应用。
参考文献
[1]刘赞,林仁翔,张凤编.商业狂潮:人工智能的未来[M].北京:机械工业出版社,2017:7-12.
[2]刘珊,黄升民.人工智能在新媒体传播中的应用趋势[J].现代传播,2019(1):83-86.
[3]江芳.移动社交背景下的短视频传播研究[J].新媒体研究,2019(8):21-22.
[4]刘雪梅,杨晨熙.人工智能:营销传播“数算力”时代的到来[J].当代传播,2017(5):7-15.
[5]傅慧.场景理论视角下移动社交短视频的价值研究[J].东南传播,2018(9):31.
作者简介:朱琦(1993-),女,湖北武汉,硕士,研究方向:新媒体传播。
因篇幅问题不能全部显示,请点此查看更多更全内容