Thuật ngữ Big Data hay “Dữ liệu lớn” khi mới nghe qua thì có vẻ như là một khái niệm trừu tượng và khó hiểu. Vì vậy để dễ hình dung hơn, chúng ta hãy cùng xem xét khái niệm này qua ví dụ đơn giản sau đây:
Một doanh nghiệp đạt được 10,000 đơn hàng mỗi ngày có thể được xem là thành công trong việc bán hàng. Dưới góc độ của dữ liệu, 10,000 đơn hàng này sẽ tương ứng với 10,000 giao dịch thành công được ghi nhận trên hệ thống đồng nghĩa với việc doanh nghiệp mỗi ngày phát sinh 10,000 dòng dữ liệu vận hành mới. Tuy vậy, so sánh với dữ liệu vận hành, tần suất và khối lượng phát sinh dữ liệu hành vi cao hơn rất nhiều lần. Ví dụ với mô hình kinh doanh online, doanh nghiệp chắc chắn sẽ cần phải biết được số lượng traffic hay khách hàng đang tương tác như thế nào trên website của mình. Để có được các thông tin này doanh nghiệp cần thu thập đến cả triệu dòng dữ liệu hành vi.
Ở góc độ kỹ thuật thì thuật ngữ Big Data được hiểu ở đây chính là công nghệ được sử dụng để giải quyết các bài toán cần xử lý lượng dữ liệu lớn như dữ liệu hành vi này.
Những nhầm lẫn phổ biến về Big Data của các doanh nghiệp là gì?
  • Ở Việt Nam, các doanh nghiệp hay nhầm thuật ngữ Big Data là ứng dụng dữ liệu nhưng Big Data chỉ liên quan tới mặt công nghệ, kĩ thuật và không hề liên quan tới cách tiếp cận và làm dữ liệu.
  • Thực tế thì hầu hết Doanh nghiệp truyền thống Việt Nam chưa chạm đến ngưỡng Big Data. Vì để được xem là Big Data cần có số lượng dữ liệu thu thập hàng ngày rất lớn (từ 10-20 triệu dòng dữ liệu mỗi ngày) và cần có cơ sở hạ tầng đặc thù để lưu trữ và xử lý.