
- Большие данные (Big Data) — это структурированные, частично структурированные или неструктурированные массивы данных большого объема разнообразного состава, часто обновляемых и находящихся в разных источниках.
- Главные источники больших данных:
- социальные сети и СМИ;
- Интернет вещей (IoT), показания датчиков;
- данные компаний: транзакции, заказы товаров и услуг, профили клиентов.
- В настоящее время большие данные характеризуются пятью V:
- Volume — объем обрабатываемых данных;
- Variety — многообразие, т. е. возможность одновременной обработки структурированной, частично структурированной и неструктурированной информации, представленной в разных форматах;
- Velocity — скорость, которая требуется для обработки данных в реальном времени и доставки их пользователю;
- Value — ценность накопленной информации;
- Veracity — достоверность как самого набора данных, так и результатов его анализа.