MỘT TIẾP CẬN MỚI VỀ ĐỐI SÁNH ONTOLOGY

Authors

  • Khoa CNTT
  • Huỳnh Nhứt Phát
  • Hoàng Hữu Hạnh
  • Phan Công Vinh

Abstract

Tóm tắt:Đối sánh ontology là một quan trọng trong kỹ nghệ ontology của Web ngữ nghĩa (SemanticWeb) với mục tiêu tìm kiếm sự liên kết giữa các thực thể của các ontology đã cho. Đối sánh ontologylà một bước cần thiết để kết hợp và chia sẻ kiến thức giữa các ứng dụng về Web ngữ nghĩa. Trongnghiên cứu này chúng tôi đề xuất thuật toán mới và một công cụ dựa trên thuật toán này để tìm sựtương đồng giữa các thực thể của các ontology đầu vào. Thuật toán đề xuất này sử dụng độ đo mới vềsự tương đồng của từ vựng và cũng sử dụng thông tin về cấu trúc của các ontology để xác định thựcthể tương ứng của chúng. Độ đo sự tương đồng về từ vựng tạo ra một túi từ cho mỗi thực thể dựa trênnhãn và thông tin mô tả của chúng. Cách tiếp cận về cấu trúc tạo thành một mạng lưới cho mỗi núttrong các ontology. Sự kết hợp của phương pháp tiếp cận về tự vựng và cấu trúc tạo thành ma trậnđồng dạng giữa ontology nguồn và ontology đích. Thuật toán đề xuất này đã được thử nghiệm dựatrên các tiêu chuẩn đã được công nhận và cũng được so sánh với các thuật toán khác hiện nay. Kếtquả thực nghiệm của chúng tôi cho thấy thuật toán đề xuất rất hiệu quả và nhanh hơn so với các thuậttoán khác.

Keywords: lexical similarity; ontology matching; Semantic Web; similarity measure; structuresimilarity

References

N. Arch-Int and P. Sophatsathit, A semantic information gathering approach for heterogeneous information

sources on WWW, Journal of Information Science29 (2003) 357–374.

M. Ehrig and J. Euzenat. Relaxed precision and recall for ontology matching, K-Cap 2005 Workshop on

Integrating Ontologies2005 (Banff, Alberta, Canada) 25–32.

L.S. Xiao and R. Ellen, Automated schema mapping techniques: an exploratory study, Research Letters

Information Science4 (2003) 113–136.

W. Cohen, P. Ravikumar and S. Fienberg, A comparison of string metrics for matching names and records,

Proceedings of the Workshop on Data Cleaning and Object Consolidation at the International Conference on

Knowledge Discovery and Data Mining (KDD)(2003).

A. Alasoud, V. Haarslev and N. Shiri, An empirical comparison of ontology matching techniques, Journal of

Information Science35(4) (2009) 379–397.

V.I. Levenshtein, Binary codes capable of correcting deletions, insertions, and reversals, Soviet Physics

Doklady10 (1966) 707–710.

G.A. Miller, WordNet: A lexical database for english, Communications of the ACM38 (1995) 39–41.

P. Bouquet, L. Serafini and S. Zanobini, Peer-to-peer semantic coordination, Journal of Web Semantics 2(1)

(2004) 81–97.

G. Pirro, A semantic similarity metric combining features and intrinsic information content, Journal of Data

and Knowledge Engineering68 (2009) 1289–1308.

A. Maedche and S. Staab, Measuring similarity between ontologies, In Proceedings of the International

Conference on Knowledge Engineering and Knowledge Management(2002) 251–263.

Published

2015-09-04