CSpace  > 高性能计算应用研究中心
基于Relative-IDF的医药数据相似度算法研究
向林泓; 张炬; 孙启龙; 赵学良
2014-06-15
摘要医药数据相似度计算在药物信息处理中具有重要的作用。传统的文本相似度计算在医药领域并不能取得很好的效果。针对医药数据文本的特殊性,提出基于Relative-IDF的医药数据相似度计算算法。实验结果表明:相比传统TF-IDF、编辑距离等计算方法,基于Relative-IDF的医药数据相似度计算在效率和准确性上都有了很大的提升。
关键词医药数据相似度 编辑距离 Relative-IDF TF-IDF
发表期刊计算机科学
期号S1页码:417-420
语种中文