DÉVELOPPEMENT D’UN SYSTÈME CONNAISSANCE POUR BIG DATA APPLICATION AUX DONNÉES DE PHÉNOTYPAGE CHEZ LE RIZ (O. SATIVA)

Depuis quelques ann ́ees, le d ́eluge de donn ́ees dans plusieurs domaines de la recherche scientifique soul`eve des d ́efis dans le traitement et l’exploitation des donn ́ees. La recherche dans le domaine bioinforma- tique n’est pas ́epargn ́ee par ce ph ́enom`ene. Ce m ́emoire pr ́esente des approches pour r ́esoudre le probl`eme de donn ́ees volumineuses stock ́ees dans des entrepˆots NoSQL en y associant la capacit ́e de recherche s ́emantique sur les donn ́ees dans un contexte de recherche agronomique. Ces approches s ́emantiques permettent d’aider ` a enrichir les donn ́ees issues d’exp ́eriences grˆace aux moteurs d’inf ́erence g ́en ́erant de nouvelles connaissances. Nous pouvons r ́esumer ces deux approches d’une part avec la r ́e ́ecriture de requˆetes et d’autre part avec la mat ́erialisation de donn ́ees en triplets RDF. Un ́etat de l’art nous a permis d’identifier et d’ ́evaluer les diff ́erentes m ́ethodes se rapportant aux approches mentionn ́ees. En pratique, seule l’approche de mat ́erialisation de donn ́ees a ́et ́e choisie pour continuer `a travailler. Les donn ́ees triplets obtenues ́etant volumineuses, nous avons r ́ealis ́e un benchmark sur diff ́erents syst`emes de gestion de base de donn ́ees de triplets afin de pouvoir comparer les avantages et les inconv ́enients de chacun et de choisir le meilleur syst`eme pour notre ́etude de cas
http://repository.vnu.edu.vn/handle/VNU_123/9876

Nhận xét

Bài đăng phổ biến từ blog này

Ai tạo ra vũ trụ này?

NGHIÊN CỨU SỰ MỌC VÀ HÌNH THÀNH QUẢ THỂ NẤM CỐC LỚN CLITOCYBE MAXIMA (GARTN. EX MEY.:FR) QUÉL

Thế giới nhân vật trong truyện ngắn Ma Văn Kháng từ 1986 tới nay