Применение глобальной оптимизации в кластерном анализе данных

Борис Залманович Белашев, Константин Анатольевич Долгий, Boris Belashev, Konstantin Dolgy

Аннотация


Алгоритмы глобальной оптимизации применены для решения задач четкой и нечеткой кластеризации данных. С их помощью при использовании разных функционалов путем моделирования в системе компьютерной математики MATLAB определены центры, границы раздела, форма кластеров. Показано, что центры кластеров, определенные алгоритмами patternsearch и методом К-средних совпадают. Преимущества алгоритмов глобальной оптимизации заключаются в единстве подхода, близости решения к оптимальному решению, отсутствии требований непрерывности и дифференцируемости целевой функции, учете линейных и нелинейных ограничений, накладываемых на переменные. Обсуждены области применения автоматической кластеризации при обработке треков в физике высоких энергий, результатов глубинного зондирования Земли, геохимических данных, изображений.

Ключевые слова


алгоритмы глобальной оптимизации; четкая и нечеткая кластеризация данных; центры, границы, форма кластеров; области кластеризации данных

Полный текст:

PDF

Литература


Jain A. K., Murty M. N., Flynn P. J. Data Clustering: A Review (http://www.csee.umbe.edu/nicholas/clustering/ p264-jain.pdf)

Kogan J., Nicholas C., Teboulle M. Clustering Large and High Dimensional Data (http://www.csee.umbe.edu /nicholas/clustering/tutorial.pdf)

Ходасевич Г. Б. Обработка экспериментальных данных на ЭВМ. Учебное пособие. СПб.: СПбГУТ, 2002. (http://dvo.sut.ru/libr/opds/i130hod2/index.htm)

Штовба С. Д. Проектирование нечетких систем средствами MATLAB. М.: Горячая линия. Телеком, 2007. С. 72-74.

Гладков Л. А. и др. Биоинспирированные методы в оптимизации. Монография. М.: Физматлит, 2009. 384 с.

Global Optimization Toolbox (http://matlab.ru/products/global-optimization-toolbox)

Лекция: Методы кластерного анализа. Иерархические методы: версия для печати и PDA. http://vudguit.no-ip.biz:3232/department/database/datamining/13/datamining_13.html

Jolliffe I. T. Principal Component Analysis, Series: Springer Series in Statistics. 2nd ed. Springer. NY. 2002. XXIX. 487 p.

Хайкин С. Нейронные сети. Полный курс. Изд-е 2. М.: Издательский дом «Вильямс», 2008. С. 573-621.

Yager R., Filev D. Essentials of Fuzzy Modeling and Control. USA: John Wiley & Sons, 1984. 387 p.

Электронный учебник MatLab www.Mat-Lab.ru

Ту Дж., Гонсалес Р. Принципы распознавания образов. М.: Мир, 1978. С. 109-112.

Holland J. Adaptation in natural and artificial systems. University of Michigan Press Ann Arbor. USA. 1975.

Krishna K., Murty M. N. Genetic K means algorithm // IEEE Transaction on System. Man and Cybernetics. 1999. Vol. 29, N 3. P. 433–439.

Шаблоны и теорема шаблонов (http://qai.narod.ru/GA/schema.html)

Dorigo M., Gambardella L. M. Ant Colony System: A Cooperative Learning Approach to the Traveling Salesman Problem // IEEE Transactions on Evolutionary Computation. 1997. Vol. 1, N 1. P. 53–66.

Parsopoulos K. E. Recent Approaches to Global Optimization Problems Through Particle Swarm Optimization // Natural Computing. 2002. Vol. 1, N 2–3. P. 235–306.

Джонс М. Т. Программирование искусственного интеллекта в приложениях. М.: ДМК Пресс, 2004. C. 25-42.

Bezdek J. C. Pattern Recognition with Fuzzy Objective Function. New York: Plenum Press, 1981.

Физика микромира. Маленькая энциклопедия / Под ред. Д. В. Ширкова. M.: Советская энциклопедия, 1980. 284 с.

Денисов С. П. Детекторы черенковского излучения // Природа. 2004. № 7. C. 22-29.

Свириденко Л. П., Светов А. П. Валаамский силл габбро-долеритов и геодинамика котловины Ладожского озера. Монография. Петрозаводск: КарНЦ РАН, 2008. 123 с.

Аэрокосмические методы геологических исследований / Под ред. А. В. Перцова. СПб.: Изд-во СПб картфабрики ВСЕГЕИ, 2000. 316 с.

Ohlander R., Price K., Reddy D. R. Picture Segmentation Using a Recursive Region Splitting Method // Computer Graphics and Image Processing. 1978. Vol. 8. P. 313–333.

REFERENCES in ENGLISH

Jain A. K., Murty M. N., Flynn P. J. Data Clustering: A Review (http:// www.csee.umbe.edu/nicholas/clustering/p.264-jain.pdf)

Kogan J., Nicholas C., Teboulle M. Clustering Large and High Dimensional Data (http://www.csee.umbe.edu/nicholas/clustering/tutorial.pdf)

Hodasevich G. B. Obrabotka jeksperimental’nyh dannyh na JeVM. Uchebnoe posobie [Processing experimental data on a computer. Textbook]. St. Petersburg: SPbGUT, 2002. URL: http://dvo.sut.ru/libr/opds/i130hod2/index.htm

Shtovba S. D. Proektirovanie nechetkih sistem sredstvami MATLAB [Design of fuzzy systems by means of MATLAB]. Moscow: Gorjachaja linija Telekom, 2007. P. 72–74.

Gladkov L. A. i dr. Bioinspirirovannye metody v optimizacii: monografija [Bioinspiration methods in optimization]. Moscow: Fizmatlit, 2009. 384 p.

Global Optimization Toolbox. URL: http://matlab.ru/products/global optimizationtoolbox

Lekscija: Metody klasternogo analiza. Ierarhicheskie metody: versija dlja pechati i PDA. [Lecture: Methods of cluster analysis. Hierarchical methods: print version and PDA]. URL: http://vudguit.no-ip.biz:3232/department/data base/datamining/13/datamining 13.html

Jolliffe I. T. Principal Component Analysis, Series: Springer Series in Statistics, 2nd ed., Springer, NY, 2002. XXIX. 487 p.

Hajkin S. Nejronnye seti. Polnyj kurs. 2 izd. [Neural networks. A comprehensive foundation. 2nd ed.]. Moscow: Izdatel’skij dom Vil’jams, 2008. P. 573–621.

Yager R., Filev D. Essentials of Fuzzy Modeling and Control. USA: John Wiley and Sons, 1984. 387 p.

Tu Dzh., Gonsales R. Principy raspoznavanija obrazov [Pattern recognition principles]. Moscow: Mir, 1978. P. 109–112.

Jelektronnyj uchebnik MatLab [Electronic textbook MatLab]. URL: www.MatLab.ru

Holland J. Adaptation in natural and artificial systems. University of Michigan Press Ann Arbor, USA, 1975.

Krishna K., Murty M. N. Genetic K means algorithm. IEEE Transaction on System. Man and Cybernetics. 1999. Vol. 29, N 3. P. 433–439.

Shablony i teorema shablonov [Schemas and the schema theorem]. URS: http://qai.narod.ru/GA/schema.html

Dorigo M., Gambardella L. M. Ant Colony System: A Cooperative Learning Approach to the Traveling Salesman Problem. IEEE Transactions on Evolutionary Computation, 1997. Vol. 1, N 1. P. 53–66.

Parsopoulos K. E. Recent Approaches to Global Optimization Problems Through Particle Swarm Optimization. Natural Computing. 2002. Vol. 1, N 2–3. P. 235–306.

Dzhons M. T. Programmirovanie iskusstvennogo intellekta v prilozhenijah [Programming artificial intelligence applications]. Moscow: DMK Press, 2004. P. 25–42.

Bezdek J. C. Pattern Recognition with Fuzzy Objective Function. New York: Plenum Press, 1981.

Fizika mikromira. Malen’kaja jenciklopedija [Physics of the microworld: a small encyclopedia]. Ed. D. V. Shirkov. Moscow: Sovetskaya jenciklopedija, 1980. 284 p.

Denisov S. P. Detektory cherenkovskogo izluchenija [Cherenkov detectors]. Priroda [Nature]. 2004. N 7. P. 22–29.

Sviridenko L. P., Svetov A. P. Valaamskij sill gabbro-doleritov i geodinamika kotloviny Ladozhskogo ozera [Valaam sill of gabbrodolerites and geodynamics of Ladoga Lake basin]. Petrozavodsk: KarRC RAS, 2008. 123 p.

Ajerokosmicheskie metody geologicheskih issledovanij [Aerospace methods of geological research]. Ed. A. V. Percova. St. Petersburg: VSEGEI, 2000. 316 p.

Ohlander R., Price K., Reddy D. R. Picture Segmentation Using a Recursive Region Splitting Method. Computer Graphics and Image Processing. 1978. Vol. 8. P. 313–333.




DOI: http://dx.doi.org/10.17076/mat151

Ссылки

  • На текущий момент ссылки отсутствуют.


© Труды КарНЦ РАН, 2014-2019