Big data nào cứ phải phân tích, mày lại lầm. Một mớ data chỉ cần thoả mãn ba tiêu chí
- to về kích cỡ
- tăng trưởng nhanh
- đa dạng về kiểu, audio, video, text chat, gps… cho mục đích lưu data viễn thông
Đó là 3v definition của big data. Mày lầm giữa định nghĩa và mục đích dung.
Phân tích là mục đích sử dụng, mày đéo đem phân tích nhưng mày có kỹ thuật trích rút đúng data mày cần, khi cần, thì hệ sinh thái big data mới giúp mày được. Mày đừng nghĩ database hay mớ băng từ giúp mày được, có thể nó vẫn lưu được nhưng mày không thế trích xuất data hiệu quả được. Data cuộc gọi 100 triệu người, mày index metadata bằng giời, database khônb phù hợp cho bài toán đó.
Mày đề cập glacier thì mày biết glacier nó lưu data gì không, object data, flat file thôi. Và nó cũng không thể đọc ngay từ glacier, muốn dùng lại phải load object từ glacier ra, và cần công cụ truy vấn khác để tìm thông tin, chứ không mò bằng răng à.
Mày đề cập đến aws làm gì, đéo bao giờ chính phủ vn dùng aws nhé