Dữ liệu lớn là gì? Big Data hay còn gọi là dữ liệu lớn nói đến tới các dữ liệu khổng lồ có cấu trúc và phi cấu trúc phức tạp được tạo ra và truyền đi nhanh chóng từ nhiều nguồn không giống nhau. Ứng dụng và những điều cần biết về Big Data?
Lúc xã hội tiếp tục tăng trưởng, ngày càng có nhiều thông tin, hay còn gọi là dữ liệu lớn, là thuật ngữ mô tả khối lượng lớn dữ liệu khó quản lý – cả có cấu trúc và phi cấu trúc – tràn trề các doanh nghiệp. nghề mỗi ngày. Nhưng vấn đề ko chỉ là loại hoặc lượng dữ liệu nhưng mà còn là cách các tổ chức thực hiện điều đó với dữ liệu. Dữ liệu lớn có thể được phân tích để thu được thông tin chuyên sâu giúp cải thiện các quyết định và mang lại sự tự tin trong việc thực hiện các bước đi chiến lược trong kinh doanh.
1. Dữ liệu lớn là gì?
Big Data hay còn gọi là dữ liệu lớn nói đến tới các dữ liệu khổng lồ có cấu trúc và phi cấu trúc phức tạp được tạo ra và truyền đi nhanh chóng từ nhiều nguồn không giống nhau. Các tính chất này tạo nên ba Vs của dữ liệu lớn:
Khối lượng: Một lượng dữ liệu khổng lồ được lưu trữ.
Vận tốc: Vận tốc cực cao nhưng mà các luồng dữ liệu phải được xử lý và phân tích.
Tính nhiều chủng loại: Các nguồn và hình thức không giống nhau trong đó dữ liệu được tích lũy, chẳng hạn như số, văn bản, video, hình ảnh, âm thanh và văn bản.
Việc tích lũy dữ liệu có thể bắt nguồn từ các nền văn minh cổ điển đã sử dụng móng tay để theo dõi thực phẩm, nhưng lịch sử của dữ liệu lớn thực sự khởi đầu muộn hơn nhiều. Dưới đây là dòng thời kì ngắn gọn về một số khoảnh khắc đáng chú ý đã đưa chúng ta tới vị trí của ngày hôm nay.
1881
Một trong những trường hợp quá tải dữ liệu trước hết xảy ra trong cuộc dò hỏi dân số năm 1880. Máy lập bảng Hollerith đã được phát minh và nhiệm vụ xử lý dữ liệu dò hỏi dân số đã giảm từ mười năm làm việc xuống còn ko. tròn một năm.
1928
Kỹ sư người Đức gốc Áo Fritz Pfleumer tăng trưởng lưu trữ dữ liệu từ tính trên băng từ, mở đường cho lưu trữ dữ liệu kỹ thuật số trong thế kỷ tới.
1948
Lý thuyết thông tin của Shannon được tăng trưởng, đặt nền tảng cho cơ sở hạ tầng thông tin được sử dụng rộng rãi ngày nay.
1970
Edgar F. Codd, một nhà toán học tại IBM, minh họa một “cơ sở dữ liệu quan hệ” cho thấy cách thông tin trong cơ sở dữ liệu lớn có thể được truy cập nhưng mà ko cần biết cấu trúc hoặc vị trí. nó là. . Điều này trước đây được dành riêng cho các chuyên gia hoặc những người có kiến thức sâu rộng về máy tính.
1976
Sử dụng kinh doanh Các hệ thống lập kế hoạch quản lý vật liệu (MRP) được tăng trưởng để tổ chức và lập kế hoạch thông tin, trở thành rộng rãi hơn để xúc tác cho các hoạt động kinh doanh.
1989
World Wide Web được tạo ra bởi Tim Berners-Lee.
Năm 2001
Doug Laney đã trình diễn một bài báo mô tả “3 Vs của dữ liệu”, đây là một tính năng cơ bản của dữ liệu lớn. Cùng năm đó, thuật ngữ “ứng dụng dưới dạng dịch vụ” lần trước hết được san sớt.
2005
Hadoop, một khung ứng dụng nguồn mở để lưu trữ các tập dữ liệu lớn, đã được tạo.
2007
Thuật ngữ “dữ liệu lớn” đã được giới thiệu với công chúng trong bài báo có dây “Sự kết thúc của lý thuyết: Cơn lũ dữ liệu làm cho phương pháp khoa học trở thành lỗi thời”.
2008
Một nhóm các nhà nghiên cứu khoa học máy tính đã xuất bản bài báo “Điện toán dữ liệu lớn: Tạo ra bước ngoặt mang tính cách mệnh trong thương nghiệp, khoa học và xã hội”, mô tả dữ liệu lớn đang thay đổi toàn cầu như thế nào. thay đổi cơ bản hình thức hoạt động của các doanh nghiệp và tổ chức kinh doanh.
2010
Giám đốc quản lý Google Eric Schmidt tiết lộ rằng cứ hai ngày một lần, mọi người tạo ra lượng thông tin bằng lượng thông tin nhưng mà mọi người tạo ra từ buổi rạng đông của nền văn minh cho tới năm 2003.
Năm 2014
Ngày càng có nhiều doanh nghiệp khởi đầu chuyển Hệ thống hoạch định nguồn lực doanh nghiệp (ERP) của họ lên đám mây. Internet of Things (IoT) được sử dụng rộng rãi với khoảng 3,7 tỷ thiết bị hoặc vật phẩm đang được sử dụng. Các kết nối được sử dụng, truyền một lượng lớn dữ liệu mỗi ngày.
2016
Chính quyền Obama đã thông báo “Kế hoạch tăng trưởng chiến lược và nghiên cứu dữ liệu lớn của liên bang”, được thiết kế để xúc tiến nghiên cứu và tăng trưởng các ứng dụng dữ liệu lớn sẽ trực tiếp mang lại lợi ích cho xã hội. xã hội và nền kinh tế.
2017
Nghiên cứu của IBM cho biết 2,5 nghìn tỷ byte dữ liệu được tạo ra mỗi ngày và 90% dữ liệu của toàn cầu được tạo ra trong hai năm qua.
Ngày nay, dữ liệu được tạo liên tục bất kỳ lúc nào chúng ta mở một ứng dụng, tìm kiếm trên Google hoặc chỉ cần điều hướng tới một vị trí bằng thiết bị di động của mình. Kết quả? Một bộ sưu tập lớn các thông tin có trị giá nhưng mà các doanh nghiệp và tổ chức cần quản lý, lưu trữ, trực quan hóa và phân tích. Các phương tiện dữ liệu truyền thống ko được trang bị để xử lý loại khối lượng và độ phức tạp này, điều này đã dẫn tới một loạt các giải pháp kiến trúc và ứng dụng dữ liệu chuyên dụng được thiết kế để quản lý tải.
2. Ứng dụng và những điều cần biết về Big Data:
Sự nhiều chủng loại của dữ liệu lớn làm cho nó trở thành phức tạp vốn có, dẫn tới nhu cầu về các hệ thống có khả năng xử lý sự khác lạ về cấu trúc và ngữ nghĩa của nó. Dữ liệu lớn yêu cầu cơ sở dữ liệu NoSQL đặc thù có thể lưu trữ dữ liệu theo cách ko yêu cầu tuân thủ ngặt nghèo một mẫu hình cụ thể.
Dữ liệu lớn về cơ bản là sự liên kết của ba V để hiểu rõ hơn và đưa ra dự đoán, vì vậy sẽ giúp xem xét kỹ hơn từng tính chất.
Âm lượng
Dữ liệu lớn là rất lớn. Trong lúc dữ liệu truyền thống được đo bằng các kích thước thân thuộc như megabyte, gigabyte và terabyte, dữ liệu lớn được lưu trữ bằng petabyte và zettabyte.
Để hiểu mức độ khác lạ về quy mô, hãy xem so sánh này từ Trường Thông tin Berkeley: một gigabyte tương đương với một video HD dài 7 phút, trong lúc một zettabyte tương đương với 250 tỷ đĩa DVD.
Đây chỉ là đỉnh của tảng băng trôi. Theo báo cáo của EMC, vũ trụ kỹ thuật số sẽ tăng gấp đôi kích thước sau mỗi hai năm và dự kiến sẽ đạt 44 nghìn tỷ zettabyte vào năm 2020.
Dữ liệu lớn phân phối một kiến trúc xử lý loại dữ liệu này. Nếu ko có giải pháp lưu trữ và xử lý thích hợp, thông tin cụ thể sẽ ko thể được trích xuất.
Véc tơ vận tốc tức thời
Từ vận tốc tạo tới lượng thời kì cần thiết để phân tích, mọi thứ về dữ liệu lớn đều nhanh chóng. Một số người mô tả nó giống như đang cố uống nước từ vòi chữa cháy.
Các doanh nghiệp và tổ chức phải có khả năng khai thác dữ liệu này và tạo ra thông tin cụ thể từ dữ liệu đó trong thời kì thực, nếu ko, nó sẽ ko hữu ích lắm. Quá trình xử lý theo thời kì thực cho phép những người ra quyết định hành động nhanh chóng, giúp họ dẫn đầu đối thủ.
Mặc dù một số dạng dữ liệu có thể được xử lý hàng loạt và vẫn thích hợp theo thời kì, nhưng phần lớn dữ liệu lớn chảy vào các tổ chức theo khối và yêu cầu hành động ngay ngay lập tức để xử lý đúng cách. Dữ liệu cảm biến từ các thiết bị y tế là một ví dụ tuyệt vời. Khả năng xử lý ngay ngay lập tức dữ liệu sức khỏe có thể phân phối cho người dùng và thầy thuốc thông tin có khả năng cứu sống.
Nhiều chủng loại
Khoảng 95% dữ liệu lớn ko có cấu trúc, điều đó có tức là nó ko dễ dàng thích hợp với một mẫu hình truyền thống đơn giản. Mọi thứ từ email và video tới dữ liệu khoa học và khí tượng đều có thể tạo thành một luồng dữ liệu lớn, mỗi dữ liệu có các tính chất riêng lẻ.
Điều này mang lại sự linh hoạt cần thiết để phân tích mạch lạc các nguồn thông tin dường như không giống nhau nhằm có được cái nhìn tổng thể về những gì đang xảy ra, hình thức và thời khắc hành động. Lúc tổng hợp, xử lý và phân tích dữ liệu lớn, nó thường được phân loại thành dữ liệu hoạt động hoặc dữ liệu phân tích và được lưu trữ tương ứng. Hệ quản lý phân phối các tập dữ liệu lớn trên nhiều máy chủ và bao gồm các đầu vào như hàng tồn kho, dữ liệu người mua và sắm hàng – thông tin hàng ngày trong một tổ chức.
Các hệ thống phân tích phức tạp hơn hệ quản lý của chúng, có khả năng xử lý các phân tích dữ liệu phức tạp và phân phối cho doanh nghiệp thông tin cụ thể về thứ tự ra quyết định. Các hệ thống này thường sẽ được tích hợp vào các thứ tự và cơ sở hạ tầng hiện có để tối đa hóa việc tích lũy và sử dụng dữ liệu.
Bất kể nó được phân loại như thế nào, dữ liệu ở khắp mọi nơi. Điện thoại, thẻ tín dụng, ứng dụng, phương tiện, tệp, trang web và hồ hết “mọi thứ” trong toàn cầu của chúng ta đều có khả năng truyền lượng dữ liệu khổng lồ và thông tin này vô cùng quý giá. Dữ liệu lớn được sử dụng trong hồ hết mọi ngành để xác định các mẫu và xu thế, trả lời các câu hỏi, hiểu rõ hơn về người mua và khắc phục các vấn đề phức tạp. Các doanh nghiệp và tổ chức sử dụng thông tin vì nhiều lý do như tăng trưởng doanh nghiệp của họ, hiểu quyết định của người mua, cải thiện nghiên cứu, đưa ra dự đoán và nhắm mục tiêu nhân vật chính cho quảng cáo.
Dưới đây là một số ví dụ về các ngành đang diễn ra cuộc cách mệnh dữ liệu lớn:
– Tài chính
Các ngành tài chính và bảo hiểm sử dụng dữ liệu lớn và phân tích dự đoán để phát hiện gian lận, nhận định rủi ro, xếp hạng tín dụng, dịch vụ môi giới và công nghệ chuỗi khối, trong số các mục tiêu sử dụng khác. khác. Các tổ chức tín dụng cũng đang sử dụng dữ liệu lớn để cải thiện các nỗ lực an ninh mạng và tư nhân hóa các quyết định tài chính cho người mua.
– Chăm sóc sức khỏe
Các bệnh viện, nhà nghiên cứu và doanh nghiệp dược phẩm đang vận dụng các giải pháp dữ liệu lớn để cải thiện và tăng lên chất lượng chăm sóc sức khỏe. Với quyền truy cập vào một lượng lớn dữ liệu về bệnh nhân và dân số, ngành chăm sóc sức khỏe đang cải thiện các phương pháp điều trị, giúp nghiên cứu hiệu quả hơn đối với các bệnh như ung thư và Alzheimer, tăng trưởng các loại thuốc mới và thu được những hiểu biết quan trọng về mẫu hình sức khỏe dân số.
– Truyền thông và Tiêu khiển
Nếu bạn đã từng sử dụng Netflix, Hulu hoặc bất kỳ dịch vụ phát trực tuyến nào khác phân phối đề xuất, thì bạn đã thấy dữ liệu lớn hoạt động. Các doanh nghiệp truyền thông phân tích thói quen đọc, xem và nghe của chúng tôi để xây dựng trải nghiệm tư nhân hóa. Netflix thậm chí còn sử dụng dữ liệu về đồ họa, tiêu đề và màu sắc để đưa ra quyết định về thị hiếu của người mua.
– Nông nghiệp
Từ hạt giống kỹ thuật tới dự đoán năng suất cây trồng chuẩn xác đáng ngạc nhiên, dữ liệu lớn và tự động hóa đang xúc tiến nhanh chóng ngành công nghiệp làm vườn. Với cơn lũ dữ liệu trong hai thập kỷ qua, thông tin dồi dào hơn lương thực ở nhiều quốc gia, các nhà nghiên cứu và nhà khoa học hàng đầu phải sử dụng dữ liệu lớn để khắc phục nạn đói và suy dinh dưỡng. Với các nhóm như Dữ liệu Mở Toàn cầu về Nông nghiệp và Dinh dưỡng (GODAN) xúc tiến quyền truy cập mở và ko hạn chế vào dữ liệu dinh dưỡng và nông nghiệp toàn cầu, một số tiến bộ đang đạt được trong trận đấu hoàn thành nạn đói trên toàn cầu.
– Các lĩnh vực ứng dụng khác
Tiếp thị quảng cáo
Kinh doanh
Thương nghiệp điện tử và bán lẻ
Giáo dục
Internet vạn vật
các môn thể thao
Bạn thấy bài viết Big Data là gì? Ứng dụng và những điều cần biết về Big Data? có khắc phục đươc vấn đề bạn tìm hiểu ko?, nếu ko hãy comment góp ý thêm về Big Data là gì? Ứng dụng và những điều cần biết về Big Data? bên dưới để thpttranhungdao.edu.vn có thể thay đổi & cải thiện nội dung tốt hơn cho độc giả nhé! Cám ơn bạn đã ghé thăm Website Trường THPT Trần Hưng Đạo
Phân mục: Kiến thức chung
Nguồn: thpttranhungdao.edu.vn
Trả lời