Пошук заданих фрагментів в архіві аудіо записів із застосуванням KD-дерев
Анотація
Монографію присвячено підвищенню повноти і релевантності результатів та швидкості пошуку за рахунок розроблення інформаційної технології пошуку заданих фрагментів в архіві аудіозаписів із застосуванням kd- дерев. З розвитком Інтернету, цифрових ЗМІ, мультимедійних технологій та можливістю доступу до великих архівів мультимедіа виникла необхідність створення нових способів навігації та взаємодії з цими архівами аудіозаписів. Сучасним інформаційно-пошуковим системам притаманні певні недоліки, зокрема: - недостатня продуктивність під час роботи з великими архівами.
Запропоновано модель корпусу аудіозаписів, яка містить масив файлів, базу параметрів та метаданих і динамічне kd-дерево, що дозволило зменшити тривалість обраного для пошуку аудіофрагмента та реалізувати інформаційну технологію пошуку аудіозаписів з різною тривалістю звучання. Показано, що мінімальна тривалість аудіофрагмента, яка забезпечує повноту результатів пошуку аудіозапису 99,4%, має складати 1 с. Отримав подальшого розвитку метод кластеризації k-середніх, який відрізняється від існуючих удосконаленою процедурою відбору вектора на позицію вставки нового центроїда шляхом послідовного запуску методу k- середніх, що дозволяє отримати розв’язок, наближений до глобального мінімуму похибки кластеризації. Удосконалено метод пошуку на основі kd-дерева, який, на відміну від існуючих, використовує оцінку міри близькості за зваженою кількістю потраплянь в список найближчих центроїдів, що дозволяє підвищити повноту та релевантність результатів пошуку. Запропоновано метод комбінованого пошуку аудіозапису за заданим аудіофрагментом, який базується на виконанні швидкого наближеного пошуку у базі параметрів зменшеної розмірності із застосуванням kd-дерева кількох найближчих аудіозаписів на першому етапі пошуку, серед яких на другому етапі відбувається вибір релевантного аудіозапису, що дозволило досягти зменшення часу пошуку порівняно з точним пошуком на основі kd-дерева. На основі результатів теоретичних досліджень розроблено інформаційну технологію пошуку заданих аудіофрагментів в архіві аудіозаписів, яка містить: алгоритм та програму для реалізації методу кластеризації на основі послідовного запуску k-середніх з удосконаленим вибором вектора на позицію вставки нового центроїда; алгоритм та програму пошуку заданого аудіофрагмента на основі математичного очікування похибки кластеризації; алгоритм та програму швидкого пошуку на основі kd-дерев; методику використання системи автоматичного пошуку аудіозаписів. Запропоновані методи та розроблені на їхній основі алгоритми та програмні засоби дозволяють проводити пошук заданого аудіофрагмента у реальному масштабі часу.