belovorus.ru

Блог о телекоммуникациях

Популярный блог - помощник для работы за компьютером и в сети Интернет

 

 

Категории

 

Новости

Где сделать анализ воды в Москве
Как-то никогда не задавалась вопросом, где можно сделать анализ питьевой воды в Москве где сделать, пока соседка не написала, что от той воды из под крана, которую мы пьем, у нас чуть ли не хвост вырастет

Пластиковые емкости для канализации
Устанавливал себе на даче канализацию, делаю все сам. дело не простое ну а что, кризис на улице нету денег платить всем подряд. Поэтому я и материал решил купить где подешевле, проехался по магазинам

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Написать администратору

Главная Новости

Анализ больших объемов данных

Опубликовано: 18.05.2024

Обычно, когда говорят о серьезной аналитической обработке, особенно если используют термин Data Mining, подразумевают, что данных огромное количество. В общем случае это не так, т. к. довольно часто приходится обрабатывать небольшие наборы данных, и находить в них закономерности ничуть не проще, чем в сотнях миллионов записей. Хотя нет сомнений, что необходимость поиска закономерностей в больших базах данных усложняет и без того нетривиальную задачу анализа.

Такая ситуация особенно характерна для бизнеса, связанного с розничной торговлей, телекоммуникациями, банками, интернетом. В их базах данных аккумулируется огромное количество информации, связанной с транзакциями: чеки, платежи, звонки, логи и т.п.

Не существует универсальных способов анализа или алгоритмов, пригодных для любых случаев и любых объемов информации. Методы анализа данных существенно отличаются друг от друга по производительности, качеству результатов, удобству применения и требованиям к данным. Оптимизация может производиться на различных уровнях: оборудование, базы данных, аналитическая платформа, подготовка исходных данных, специализированные алгоритмы. Анализ большого объема данных требует особого подхода, т.к. технически сложно их переработать при помощи только "грубой силы", т.е. использования более мощного оборудования.

Конечно, можно увеличить скорость обработки данных за счет более производительного оборудования, тем более, что современные сервера и рабочие станции используют многоядерные процессоры, оперативную память значительных размеров и мощные дисковые массивы. Однако, есть множество других способов обработки больших объемов данных, которые позволяют повысить масштабируемость и не требуют бесконечного обновления оборудования.

Перейти на начало страницы

 

Copyright @ 2003 г. Беловский центр телекоммуникаций, Кемеровский филиал

ОАО "Сибирьтелеком"

Каталог Апорт


Directrix.ru - рейтинг, каталог сайтов

Лучшие интернет магазины

Туристический форум ездок. Турция, Египет, другие страны