万方文察为科研诚信保驾护航


  在过去的十余年中,科技信息服务领域构建了以科技论文文本内容为检测对象的文字相似性检测工具,用以支撑投稿、学位论文提交等环节的查处工作。但随着学术论文不端问题的日益复杂与隐蔽,诚信风险早已不仅仅只是文本上的抄袭,在期刊论文发表阶段的一稿多发、虚假同行评议乃至论文工厂,作者不当署名,失信惩戒,基金资助的虚假标注,图像的重复使用,篡改造假,参考文献虚假标注或引用问题论文等都需要认真甄别、仔细核对,避免可能存在较大的失信风险。

万方文察论文科研诚信风险综合筛查服务

  新时期,围绕着科研失信行为的各类表现,构建多样化、立体化的软件工具支撑查处尤为重要。在此背景下,面向论文学术不端治理需求,万方数据公司基于文本相似性检测、图像检测等核心技术及科研诚信大数据资源基础,研发推出了科技论文科研诚信风险综合筛查服务——万方文察,通过一站式综合服务,实现对论文文本相似性、图像复用、AIGC风险、引文及作者等多要素的一次提交,多维检测,帮助教育、科研、出版、管理等诚信监管机构及早发现风险线索并采取相应的措施。

A 高效、准确、专业的文本、图像检测技术

  万方数据自主研发的“句子级正交基软聚类倒排”专利检测算法,支持高准确性、高效率的文本检测;AIGC文本识别深度学习模型,则利用神经网络的强大表达能力,判断人机生成文本之间的差异,可识别目前较为通用的AI写作模型;基于图像特征点的检测匹配算法,针对论文内的条带图、造影图、染色图等多类型图片进行复用情况检测,并将图像之间的相同区域通过连线的方式输出匹配结果;科研诚信风险大数据监测与核查技术,通过大数据深度分析和挖掘,实现对科研实体风险监测预警与核查鉴证服务。

  B 业界领先的大数据资源底座

  文献相似性比对资源库:收录多种来源的学术文献、专业文献、学术网文在内共计超6亿的全文比对资源,根据资源类别等维度建设14个比对资源库。

  科研诚信风险大数据资源:应用科研诚信大数据池串联全方位数据轨迹,包括论文撤稿信息、论文发表后同行质疑信息、学术预警期刊数据、公开惩处数据信息及并基于图像、相似比等回溯检测信息的筛查数据等。通过实体抽取关联做到诚信风险的实时动态监测,助于发现不同环节和不同程度的科研失信风险线索。

  科技文献图像数据资源库:图像比对库收录来自Pubmed、Elsevier、Springer、Wiley等学术出版机构及开放获取平台的期刊论文、学位论文、会议论文等中英文资源,涵盖领域包括且不限于医学、健康、化学、生物学等,共计5000余万张图片数据。

  C 便捷的操作使用流程万方文察操作简单,用户只需填写基础信息后,将论文提交至系统中即可, 系统会自动对论文各项数据进行分析和比对,察验风险问题,并提供详实的察验报告。

  D 综合性展示察验结果以指标形式展示论文文本相似比、AI生成文本比、图片复用情况、作者风险情况、基金风险情况、参考文献风险情况等多维度结果指标,以及论文本身撤稿、学术质疑等情况。

  E . 针对如何发现隐匿在学术论文中的AI生成图像这类需求,文察-综合察验正式推出AI生成图片检测功能,产品搭载学术图像生成式伪造检测算法,为学术界构建起抵御AIGC图像伪造的智能防线。

  目前文察-综合察验的一站式多要素综合检测可支持作者投稿前自查、辅助期刊编辑部的审稿、协助管理机构更好的管理机构成果,防范系统性学术不端风险。相信各功能模块的不断优化,能够进一步服务好个人用户与机构客户,开启学术图像的“数字验真”时代。