DÉVELOPPEMENT D’UN SYSTÈME CONNAISSANCE POUR BIG DATA APPLICATION AUX DONNÉES DE PHÉNOTYPAGE CHEZ LE RIZ (O. SATIVA)
Depuis quelques ann ́ees, le d ́eluge de donn ́ees dans plusieurs domaines de la recherche scientifique
soul`eve des d ́efis dans le traitement et l’exploitation des donn ́ees. La recherche dans le domaine bioinforma-
tique n’est pas ́epargn ́ee par ce ph ́enom`ene. Ce m ́emoire pr ́esente des approches pour r ́esoudre le probl`eme
de donn ́ees volumineuses stock ́ees dans des entrepˆots NoSQL en y associant la capacit ́e de recherche
s ́emantique sur les donn ́ees dans un contexte de recherche agronomique. Ces approches s ́emantiques
permettent d’aider `
a enrichir les donn ́ees issues d’exp ́eriences grˆace aux moteurs d’inf ́erence g ́en ́erant
de nouvelles connaissances. Nous pouvons r ́esumer ces deux approches d’une part avec la r ́e ́ecriture de
requˆetes et d’autre part avec la mat ́erialisation de donn ́ees en triplets RDF. Un ́etat de l’art nous a
permis d’identifier et d’ ́evaluer les diff ́erentes m ́ethodes se rapportant aux approches mentionn ́ees. En
pratique, seule l’approche de mat ́erialisation de donn ́ees a ́et ́e choisie pour continuer `a travailler. Les
donn ́ees triplets obtenues ́etant volumineuses, nous avons r ́ealis ́e un benchmark sur diff ́erents syst`emes
de gestion de base de donn ́ees de triplets afin de pouvoir comparer les avantages et les inconv ́enients de
chacun et de choisir le meilleur syst`eme pour notre ́etude de cas
http://repository.vnu.edu.vn/handle/VNU_123/9876
http://repository.vnu.edu.vn/handle/VNU_123/9876
Nhận xét
Đăng nhận xét