日前,,,,,,第39次天下盘算机清静学术交流会在西愉逸成举行,,,,,,作为运动主要环节,,,,,,本届优异论文评选效果在运动现场重磅揭晓。。。。。。。。3377体育网官网入口李娇、吴亚飚,,,,,,中国科学院大学盘算机科学与手艺学院张玉清撰写的《面向网络清静关系抽取的大型语言模子数据增强》,,,,,,从496篇论文中脱颖而出,,,,,,成为本届唯一的优异论文,,,,,,并刊登于《信息网络清静》2024年第10期。。。。。。。。









目今,,,,,,以人工智能为代表的新一轮科技革命和工业厘革正在孕育兴起,,,,,,带来新的机缘和生长空间,,,,,,只有坚定不移举行科技立异,,,,,,加速培育和形成新质生产力,,,,,,才华占得先机、赢得优势。。。。。。。。今年9月,,,,,,天下网络清静标准化手艺委员会宣布《人工智能清静治理框架》1.0版,,,,,,以勉励人工智能立异生长为第一要务,,,,,,以有用提防化解人工智能清静危害为起点和落脚点。。。。。。。。
在第39次天下盘算机清静学术交流会-网络综合治理分论坛上,,,,,,3377体育网官网入口李娇针对《面向网络清静关系抽取的大型语言模子数据增强》论文举行了分享。。。。。。。。她指出,,,,,,随着信息手艺的一连前进,,,,,,网络威胁日益多样。。。。。。。。为有用掌控网络威胁态势并应对未知危害,,,,,,网络与剖析网络威胁情报至关主要,,,,,,这有助于我们迅速洞察新兴的网络威胁和误差。。。。。。。。

3377体育网官网入口 李娇
网络威胁情报大多以非结构化文本形式保存,,,,,,如清静剖析报告和博客,,,,,,其内部关联信息难以直接获取。。。。。。。。关系抽取手艺能够有用挖掘和剖析这些情报,,,,,,为网络清静防御提供主要信息。。。。。。。。然而,,,,,,网络清静领域的关系抽取使命常面临数据集稀缺的问题。。。。。。。。
为解决这一问题,,,,,,数据增强手艺应运而生,,,,,,它能够在标注数据有限的情形下自动天生大宗伪训练数据。。。。。。。。但现有的数据增强要领,,,,,,例如随机删除、插入和同义词替换等,,,,,,虽然能够天生数据,,,,,,但往往保存噪声,,,,,,准确性和多样性受限,,,,,,难以完全替换人工标注数据。。。。。。。。近年来,,,,,,大型语言模子依附卓越的文本天生能力,,,,,,为数据增强提供了强盛支持。。。。。。。。基于此,,,,,,我们提出一种基于大型语言模子的多粒度数据增强要领MGDA。。。。。。。。
该要领首先基于贪心算法的基本头脑,,,,,,从原始标注数据集中选择最具代表性的数据举行增强,,,,,,以提高运行效率。。。。。。。。然后,,,,,,从单词、短语、语法和语义四个粒度对采样数据举行转化,,,,,,确保天生的新数据在切合原始训练数据语义要求的同时,,,,,,具备更高的多样性,,,,,,从而提升后续模子训练的有用性。。。。。。。。为了提高峻型语言模子天生文本的准确性,,,,,,我们接纳角色饰演和头脑链提醒相团结的方法结构提醒模板,,,,,,以获取高质量的输出。。。。。。。。实验效果批注,,,,,,文章所提数据增强要领有用改善了网络清静关系抽取使命上的有用性以及天生数据的多样性。。。。。。。。


人工智能赋能网络攻防、开源情报等国家清静相关领域,,,,,,是筑牢国家清静屏障的有力抓手。。。。。。。。近两年来,,,,,,人工智能在大模子手艺上的突破让网络清静智能化历程加速,,,,,,3377体育网官网入口2014年最先开展AI手艺在产品中的工程化应用,,,,,,融合巨细模子面向万能力打造智能协同,,,,,,并推出天问系列产品,,,,,,提供一站式清静智能化解决计划,,,,,,助力构建网络清静新名堂。。。。。。。。

京公网安备 11010802026257号