研究背景:
随着互联网和信息技术的发展,大量的日志数据被生成和记录。从海量的日志数据中挖掘关联分析规则,对于发现安全事件、分析用户行为、优化业务流程及改进系统性能等具有重要意义。
研究内容:
- 充分调研国内外事件提取和日志关联分析现状,根据大模型或算法等技术,构建关联分析模型,用于提取基于多设备或多类型日志的关联规则,给出具体的实现过程,包括但不限于数据预处理方法、关联分析模型(或算法)设计、关联规则生成与验证、关联分析模型应用等。
- 对设计的算法或模型进行验证,并完成准确性、稳定性及其他性能测试。
(1)基于实际日志数据,使用设计的模型(或算法)完成如下要求:
① 通过日志数据,挖掘不少于50种关联规则,并给定关联规则的具体信息,包括但不限于规则名称、关联日志、规则关联条件、规则生成条件(时间特征、行为特征、数据特征)等。
关联场景示例1:用户日志发现某个员工账户在非工作时间进行了大量的数据检索操作,文件审计日志记录该员工从敏感数据存储区域下载了大量文件,邮件服务器日志显示该员工将文件发送至外部邮箱,通过关联这些日志数据,可能表明该员工正在泄露敏感信息,即定义事件为"敏感信息泄露"。
关联场景示例2:某公司核心数据库前端部署了防火墙系统,某日安全系统监测发现员工A登录了MySQL数据库服务器,但在防火墙日志中并未发现员工A的访问日志,则说明员工A可能绕过防火墙直接登录数据库服务器,即定义事件"内部人员绕过防火墙直接访问数据库"。
② 基于设计的模型(或算法),在实际应用场景中完成验证,保证使用人员能够通过该模型挖掘新的关联规则。
(2)基于设计的模型(或算法),给出各种测试指标值的计算过程及论证结果:
① 模型(或算法)的准确性计算指标及结果;
② 模型(或算法)的压力测试过程及结果;
③ 模型(或算法)的性能测试结果:时间复杂度、空间复杂度;
④ 大规模数据下模型(或算法)的运行时间及资源(CPU、内存)消耗;
⑤ 异常处理和错误测试。
研究经费:预计20万元以内(根据项目实际情况进行调整)
项目周期:2024年9月至12月
交付物:
- 研究报告:包括研究背景、研究内容、研究方案、模型(或算法)设计与实现、模型(或算法)验证过程及结果、模型(或算法)应用实例。
- 代码:提供完整的实现源代码、测试源代码、可执行程序等。
- 专利:将设计方案形成专利,专利内容应避免侵犯其他相关方案的专利,项目周期内至少1项专利被受理。
- 论文:将基于日志数据的事件提取和关联关系挖掘方案形成论文,论文内容应避免重复已有文献中的研究成果,项目周期内至少发表1篇相关领域的核心以上期刊论文或国际会议论文。
申请条件
- 全国具有法人资格的高校、科研院所;
- 具有较强的研发团队、科研条件和自主研发能力,在相关领域具有良好科研业绩,有能力完成项目任务;
- 能对项目的技术需求,提出计划合理、目标清晰、路线可行的技术攻方案,项目相关核心技术应有自主知识产权无知识产权纠纷;
- 具有良好的科研道德和社会诚信,无在惩戒执行期内的科研严重失信行为记录和相关社会领域信用"黑名单"记录;
- 项目负责人应为揭榜牵头单位在职、在岗人员,项目负责团队应弘扬科学家精神,能将主要精力用于项目实施。
项目要求
- 请有意向申报的科研人员填写《项目申报书》。
- 知识产权说明:项目所取得的研究成果,知识产权(包括专利、软著等)及研究成果归出资方所有,项目提交的成果需确保能用于出资方的商业应用。
- 承担项目团队不得将项目的全部或一部分再委托给他人完成。
公示截止日期
2024年8月20日