图书馆智慧媒资管理平台建设实践研究

点击数:276 | 发布时间:2024-11-14 | 来源:www.tbdzsw.com

    1引言

    在云数据年代,图书馆趋向从环境、资源、服务、空间、内容等多个维度寻求新的平衡,在由“数据资源环境”向“常识资源环境”的转变中建构新的常识组织体系,并在开放式的技术革新环境中开发数字图书馆空间的新功能,挖掘内容资源的新价值。借助AI技术将图书馆数字资源进行细颗粒度建设,对多元的常识内容进行结构化,让资源达成充分互联互通,为读者提供人性化、专业化、智慧化的常识服务,是图书馆将来进步的趋势。一直以来,作为图书馆资源的要紧组成部分,视听资源因受技术、存储、管理等方面的制约,非常难充分发挥其常识服务的功能。本文通过剖析图书馆媒资管理近况及存在问题,结合广州图书馆建设公共图书馆智慧媒资管理平台实践,探讨智慧媒资管理平台对智慧图书馆建设的意义,为图书馆从传统的数字资源建设向常识发现、常识组织、常识管理、常识服务转型提供考虑路径。

    2国内图书馆媒资管理近况及存在问题

    2.1图书馆媒资管理近况

    媒资,即媒体资产,主要包含视频、音频、图像、文档等多种内容资产。这个定义最早出目前广播电视行业,即电台、电视台等媒体机构生产的很多音视频、图片、文字等业务数据。媒资管理平台,即结合计算机、网络与多媒体技术,解决媒体资料的编目检索、存储与发布的平台。笔者在知网上以“图书馆媒资管理”分别为题名、全文、关键字进行检索,查到的文献很有限。最早开始在图书馆范围进行实践探索和研究媒资管理的是浙江传媒学院图书馆员阮海红,其发表的论文《媒资内容管理实验研究》从视听资料载体的复杂多样、介质保养存在的问题等方面对图书馆媒资管理的必要性进行了论证,剖析了媒资管理软件的特征和功能,并通过规范元数据描述来创建独具特点的数据库,从而提高资源价值。竺亚珍、马惟哲在《高校图书馆媒体资产管理软件建设》一文中探讨了合适高校图书馆的媒体资产管理软件,并从信息处置、内容管理、内容存储和应用等方面剖析了浙江传媒学院打造的媒体资产管理软件。钱静在视听资源储存介质保存年限短、检索和共享困难等方面剖析了媒资管理的必要性,并结合淮安楚州区图书馆实质应用,打造包含采集上载、编目检索、存储、应用发布等子系统在内的媒资管理软件,并就建设过程中注意的问题提出建议。资料研究发现,图书馆打造媒资管理软件更多是为知道决视听资源存储、编目检索、应用发布,但还未对视听资源的常识进行精细化揭示和专题聚类,深度挖掘视听资源的文献价值。

    2.2图书馆媒资管理存在的问题

    广州图书馆广州纪录片研究展示中心(以下简称“中心”)是中国第一家致力于纪录片珍藏、整理、研究、展示、服务的公共文化平台,主要通过资源采购、社会捐赠、资源共享等方法建设纪录片馆藏资源。现在,馆藏纪录片资源4000余部/集,其中音像出版类DVD介质的纪录片约占90.8%,数码格式的纪录片占9.2%;与当地广播电视台共建共享的城市数字影像资源近两千小时。因无专门的系统对纪录片资源进行统一的数字化管理,致使中心馆藏资源在存储安全、版权管理、应用服务等方面遭到非常大制约。

    (1)资源存储安全风险。中心很多的音像出版类纪录片资源仍然是依赖DVD、VCD光盘介质存储,因为受环境影响和自己老化,大概致使这部分存储的影像水平降低,甚至数据丢失;一部分数字资源存储于移动硬盘和服务器。媒体资源的分散性存储,对数据库的安全性和统一管理带来风险和困难程度。

    (2)资源版权管理风险。中心馆藏的纪录片及城市影像资源的版权在用范围、期限、播映次数等方面不尽相同,现在只可以靠人工对版权信息进行统计管理,但伴随馆藏量的日益增长与版权用的多样性,存在版权用和管理的风险。(3)编目较单一。现在馆藏纪录片资源均根据《中国文献编目规则》和《中国图书馆分类法》进行编目。但中心馆藏中有一部分是与广播电视台共建共享的城市影像资源,这类资源中包含电视节目、新闻等,则根据《广播电视音像资料编目规范》进行编目。电视资料部分的元数据项从上到下分节目层、片段层、场景层、镜头层四个层次,每一个层次分别包括相应的元数据项。因此,有效统1、规范中心馆藏资源的编目规则,对以后为读者提供更精确、高效的查看检索尤为重点。

    基于以上问题,在图书馆打造媒资管理平台是一种行之有效的解决方案。调查发现,数字媒资管理平台从功能、服务形态和应用方面已不能满足精细化的常识服务需要。数字图书馆的服务模式要从提供文献资源的检索获得借助向提供深层次多元化的常识服务转变,这就不能离开各类智能技术的辅助。

    因此,以AI为驱动的智慧媒资管理更符合智慧图书馆未来发展趋势:一方面,可使视音频资料在从采集上载到发布下载的处置过程和工作步骤上达成智能化管理,从而节省管理本钱、人力本钱和时间本钱,让媒资管理更为科学、高效;其次,对媒体资源进行细颗粒度智能标签标引和专题聚类,可提高检索效率和检索结果的准确性,与媒体素材的应用价值。

    3广州图书馆智慧媒资管理平台建设实践

    3.1建设目的

    通过搭建广州图书馆智慧媒资管理平台,达成对存储在不同介质的视音频等媒体资源的采集,并对编目元数据描述信息、版权信息等进行统一规范和管理。借助人脸辨别、语音辨别、文字辨别、常识图谱、语义互联网剖析等智能计算技术,对媒资内容中的人物、机构、地址等进行辨别剖析并生成标签,通过抽取关键字来对标签进行标引,达成资源的专题化聚类和精细化揭示。

    3.2建设内容

    3.2.1平台框架

    使用云平台有关技术,构建包括软件应用层、平台服务层、基础资源层在内的智慧媒资管理平台,并通过“平台+工具+服务”的技术框架,将多元的服务和工具组合满足不一样的业务需要。使用分布式的步骤设计,在现有基础构造上,达成媒体资源、媒体数据、业务数据分级存储。

    智慧媒资管理平台框架设计分三层:

    (1)软件应用层:媒体资源管理平台在业务软件上包含远程回传、文件上载、辅助技审、内容编目、检索浏览、出库下载、版权管理、近线归档、数据统计等功能。

    (2)平台服务层:提供媒体资源管理平台后台支撑和应用服务,包含分布式框架服务、负载均衡高可用服务、转码服务、技审服务、迁移服务、资源导入导出服务、资源归档服务、编目的引服务、工作流引擎服务、检索引擎服务、分级存储服务、接口服务等媒体专用服务。

    (3)基础资源层:主要包括计算资源、存储资源及互联网资源。

    3.2.2资源采集

    智慧媒资管理平台通过工作站,对存储在包含光盘、当地磁盘、互联网磁盘和移动硬盘等不同介质的媒体资源进行采集。采集获得文件的元数据描述信息,并抽取文件EXIF信息等数据进行存储记录。采集过程中对视频水平进行测试,辨别并标识所采集视频资源中的彩条、黑场、静帧等文件损毁状况。采集工作站支持VOB、DAT等光盘文件格式,与MP4、WMV、MPG等容易见到数码视频格式和MXF、AVI、MOV等专业视频格式,同时支持对4K、8K等超好看的视频的采集。

    3.2.3智能标签标引

    在智慧媒资管理平台中,标签是指视频片段的关键字集合。它通过智能信息提取和融合推理,将人物、地址、机构等类别的关键字进行辨别,输出为对应视频的标签。标引是对视频内容进行的一个赋予检索标识的过程,点击标引信息可以自动定位到呈现的具体一帧视频。

    智能标签的形成历程了输入、处置、输出三个环节。第一对生产过程数据、录入数据和智能辨别数据进行补充、转换、分解或映射,形成标签的基本元数据、版权元数据、内容标签数据。其中,生产过程数据包含入库时间、入库者、入库来源等信息,依据概念好的信息进行智能化编入目录;录入数据包含标题、版权、主题词等,由人工录入;智能辨别数据则是通过语音辨别、人脸辨别和OCR辨别获得。语音辨别是将视频中的声音进行连续语音辨别并转文字,进行语义剖析,自动生成关键字和入出点、自动摘要、自动分类等信息;人脸辨别则是通过自动辨别和打造人脸特点模型,标引视频画面中特定人物人脸地方,对人脸抽取特点后,用人脸特点模型进行身份确认;OCR辨别是对视频中文字地区进行辨别剖析,其结果包括视频中的文字内容和对应的文字坐标信息。

    最后,经融合推理后的标签输出形成为内容结构化数据,包含节目、镜头、场景等分层结构化标签。输出的结构化数据可通过人工进行修正,修正的结果会作为学习的样本重新带回数据处置过程。借助智能计算技术生成精准到视频内容片段的标引,生成对应的标记点信息,通过点击标记点可以迅速定位到标记点地方,系统还可自动将标引信息与AI信息库比对校验,确保定位到标记点地方的准确性。

    3.2.4编目元数据

    在实践中发现,传统的著录方法对视频资源的揭示深度愈加有限,因此,广州图书馆智慧媒资管理平台的编目元数据在设计之初,从内容描述、技术参数描述和管理描述等方面,在《中国文献编目规则》和《中国图书馆分类法》的基础上,融合了《广播电视音像资料编目规范》的著录规则,即可对各种视音频文件进行基于时间线操作方法的多级编目(包含场景层、片段层、镜头层),对所选媒体资源内容拆分的结构需要符合《广播电视音像资料编目规范》。一方面可满足各类纪录片编目信息,其次可满足与广播电视台共建共享资源的编目。

    3.2.5专题汇聚

    平台可对已进行自动化标签标引的媒体资源进行重新聚类,形成主题化、专题化的分类揭示,从而达成自动化常识发现。馆员可在后台,根据自概念视频分类,依据需要的关键字,自动匹配标签标引信息进行主题化、专题化的汇聚和展示,符合设置条件的片段或者文件自动形成专辑。专题汇聚技术应用是基于智能剖析结果内容,剖析结果依据云数据的相同种类汇聚,最后以关键字与标题的提取进行汇聚呈现。比如,要打造一个与“军事”有关的视频专题,可以在系统后台页面创建专题,通过选择智能汇聚,将包括有“军事”标签的视频自动汇聚到创建的“军事”专题中,大幅度提高了资源的专题分类管理和聚类揭示。

    3.2.6版权和内容安全管理

    严格根据《中华人民共和国著作权法》和《互联网信息传播权保护条例》,对纪录片等视频资源进行统一的版权管理。在平台版权管理模块,可自概念填写资源的版权有关信息,包含版权方、责任人、版权种类、版权期限、版权用地区等,也可批量对版权信息进行统一录入,平台还会依据版权授权期限进行自动到期提醒,确保资源版权管理的规范,防止版权用风险。为预防涉敏内容出目前应用前端,可对媒资素材进行密级管理,并做公开、非公开、机密等权限的区别,确保资源内容的安全性。

    3.3平台建设中值得关注的问题

    智慧媒资管理平台建设中应该注意以下四个方面的问题:

    (1)语音辨别。在有限预算内,最好是对视听资源的语种进行总体评估,从而选择相应的语音辨别功能模块。譬如广州图书馆有一部分纪实影像资源是粤语,那样最佳选择以中文、粤语为主的语音辨别功能模块。语音辨别的语种模块越多,所涉及的成本也势必会多,因此在项目开始之初,需将这部分成本纳入到统筹规划中考虑。

    (2)存储方法。如条件允许,最好在媒资管理平台的建设上采取云存储与当地存储相结合的模式。因地方政策缘由,广州图书馆的资源需要存储在政务云上,所以媒资管理平台运行会受馆内带宽影响,也将对将来业务扩展带来肯定的限制。

    (3)人脸样本库。为确保视频中的敏锐人物及有关场景、片段不会出目前读者应用前端,需在平常视频入库时做好人脸样本采集,不断丰富人脸样本库。一旦发现问题可即时智能匹配搜索有关视频予以封存。

    (4)智能水印。在智慧媒资管理平台中最好对视音频数字化内容,特别是网站源码文件、高码资源加注隐性水印,以保护版权的属性,便于追溯素材的来源。

    4智慧媒资管理平台对智慧图书馆建设有哪些用途

    智慧图书馆是图书馆在新的技术环境下为满足用户新需要而产生的新型形态,是图书馆进步的方向,是智能技术和人文智慧的融合。智慧媒资管理平台建设,将发挥以点带面有哪些用途,通过智能方法深度挖掘视听资源价值,对图书馆从以文献检索传递为主向以满足用户对信息借助多样化需要为主的常识服务转变,具备探索意义。

    4.1智能标签与编目元数据结合,提高图书馆的常识发现能力

    图书馆服务就是要将这类很多的数字资源进行常识组织、常识管理和常识服务,而常识发现无疑是其中非常重要的闪光点。智能标签与编目元数据结合,让常识发现更为全方位和精确。智能标签的优势在于目的单一,对资源内容进行提炼、概括成为词汇,这种形式便于计算机进行统计性规律的挖掘与应用。标签的劣势在于仅用词汇描述,信息表达总是不够精确、全方位,细节容易丢失,复杂关系很难体现。编目的优势在于结构严谨,有一套从管理、内容、技术标准等每个层面的完整体系对资源进行描述,但编目的劣势在于著录时总是考虑维度单一,资源内容信息著录不足,同时因为编目元数据的复杂结构,也不利于计算机的统计剖析。

    因此,智能标签和编目有着非常强的互补性,实质应用中二者的结合可为用户带来更好的用法体验。当用户需要查找某一具体资源,使用纯标签检索方法查不到时,可以再联合编目元数据内容进行联合检索、扩大范围,提高信息查看的全方位性和精确度,从而提高图书馆常识发现能力。

    4.2基于智能标引的时码定位,强化图书馆的常识服务功能

    在智慧媒资管理平台中,每一个内容标签都是常识颗粒,都有它有哪些用途域,即标签标引与视频画面有着强有关。在一个内容单元内,精细化标注该标签所对应事物在画面上出现的多组入出点信息,即时码信息。如此的标签在数据结构上会对应多组入出点信息,并可以时码段方法进行展示,便捷在找到素材后迅速准确定位到检索用户最有兴趣的镜头画面上,不需对视频画面进行逐帧拖移查找,大大提高画面定位效率。

    图书馆除去采购很多的视频资源,同时还需拓展自制视频的工作,如公开课、讲述史拍摄等,如要对很多的视频素材进行剪辑,智能标引可大幅度提高对素材的精确查找,使后期制作越发便捷。同时,馆员在对视频素材进行汇编时,标签结合智能标引的应用,能够帮助馆员高效完成汇编工作。智能技术与馆员智慧的融合,将为读者提供嵌入式服务奠定基础,驱动图书馆的服务升级。

    4.3基于智能聚类的常识组织,充分挖掘图书馆的资源价值

    在智慧图书馆进步理念中,常识组织在常识和信息的获得与交互方面饰演着要紧角色。常识组织在前向资源驱动和后向借助导向用途下,通过常识挖掘、常识发现、常识融合、定制推送、智能搜索等多种智能技术,发现隐含在信息中的有用信息单元并组织成常识库,然后提供给用户,满足用户常识的需要,为用户提供卓有效果的常识服务。

    基于资源内容和常识的智能聚类,就是依赖资源标签的相似性对常识进行组织、融合。譬如,用户在浏览一个视频中的镜头是广州珠江,系统通过语音和OCR字幕辨别出“广州”和“珠江”两个高价值标签,用户就能通过这两个标签找到一系列包括有“广州”“珠江”标签的视频,也就是在“广州”和“珠江”间打造了常识体系联系。将来,假如在不同标签间打造关联,基于标签打造各类常识体系,形成上下位关系、平行关系,还可以形成更有价值的内容推荐。这种智能聚类功能将满足用户高层次常识需要,从而提高资源价值,增强用户黏性。.

  • THE END

    声明:本站部分内容均来自互联网,如不慎侵害的您的权益,请告知,我们将尽快删除。

专业院校

返回顶部

Copyright©2018-2024 中国人事人才网(https://www.xftgo.com/)
All Rights Reserverd ICP备18037099号-1

  • 中国人事人才网微博

  • 中国人事人才网

首页

财经

建筑

医疗