Анализ больших наборов данных Юре Л.,Ананд Р.,Джеффри Д. У.
Material type: TextLanguage: Russian Publication details: Москва ДМК Пресс 2016Description: 498 сISBN: 978-5-97060-190-7Subject(s): алгоритмы программирования | анализ данных | добыча данных | кластеризация | машинное обучение | персональные компьютеры | программный стек | размерностиOnline resources: Click here to access online | Click here to access online Summary: Эта книга написана ведущими специалистами в области технологий баз данных и веба. Она будет в равной мере полезна студентам и программистам-практикам. Благодаря популярности веба и интернет-торговли появилось много чрезвычайно объемных баз данных, для извлечения информации из которых можно применить методы добычи данных. В книге описываются алгоритмы, которые реально использовались для решения важнейших задач добычи данных и могут быть с успехом применены даже к очень большим наборам данных. Изложение начинается с рассмотрения технологии MapReduce - важного средства распараллеливания алгоритмов. Излагаются алгоритмы хэширования с учетом близости и потоковой обработки данных, которые поступают слишком быстро для тщательного анализа. В последующих главах рассматривается идея показателя PageRank, нахождение частых предметных наборов и кластеризация. Во второе издание включен дополнительный материал о социальных сетях, машинном обучении и понижении размерности.Библиогр.: доступна в карточке книги, на сайте ЭБС Лань
Эта книга написана ведущими специалистами в области технологий баз данных и веба. Она будет в равной мере полезна студентам и программистам-практикам. Благодаря популярности веба и интернет-торговли появилось много чрезвычайно объемных баз данных, для извлечения информации из которых можно применить методы добычи данных. В книге описываются алгоритмы, которые реально использовались для решения важнейших задач добычи данных и могут быть с успехом применены даже к очень большим наборам данных. Изложение начинается с рассмотрения технологии MapReduce - важного средства распараллеливания алгоритмов. Излагаются алгоритмы хэширования с учетом близости и потоковой обработки данных, которые поступают слишком быстро для тщательного анализа. В последующих главах рассматривается идея показателя PageRank, нахождение частых предметных наборов и кластеризация. Во второе издание включен дополнительный материал о социальных сетях, машинном обучении и понижении размерности.
Книга из коллекции ДМК Пресс - Информатика
There are no comments on this title.