Tóm tắt Everybody Lies Mọi người đều nói dối - Dữ liệu lớn, Dữ liệu mới và những điều Internet tiết lộ về chính chúng ta tác giả Seth Stephens-Davidowitz
Everybody Lies sẽ mở rộng tầm hiểu biết của bạn
về bản chất thực sự của con người bằng cách giải thích dữ liệu lớn là gì, nó xuất
hiện như thế nào và làm thế nào chúng ta có thể sử dụng nó để hiểu rõ hơn về bản
thân mình.
Bạn cảm thấy thế nào khi Google có đầy đủ thông
tin về bạn? Tôi có một thành viên trong gia đình từng tin rằng đó là một vấn đề
lớn. Anh ấy không sử dụng công cụ tìm kiếm của Google hoặc thậm chí cân nhắc đến
việc có tài khoản Gmail!
Mặc dù mọi người đều có quyền lựa chọn những
gì họ sẽ và sẽ không sử dụng, nhưng tôi tin rằng việc thu thập thông tin trên
internet là một điều tốt. Nó giúp các trang web biết cách tiếp thị tốt hơn cho
nhu cầu của chúng ta. Và chúng ta có thể học được rất nhiều điều về bản chất
con người khi xem xét dữ liệu và sử dụng dữ liệu đó để cải thiện xã hội.
Dữ liệu lớn, như tên gọi của nó, là một phần
quan trọng trong thế giới kỹ thuật số của chúng ta. Hiểu được dữ liệu này rất
quan trọng đối với tương lai của chúng ta và cuốn Everybody Lies: Mọi người đều
nói dối đã giải thích rất chi tiết về điều đó.
Sau đây là 3 bài học lớn nhất đã mở mang tầm
mắt của tôi về con người:
1-Dữ liệu lớn tốt hơn con người trong việc
xác định các mô hình trong hành vi của con người vì nó sử dụng các mẫu lớn hơn
để đưa ra kết luận.
2-Mọi người nói dối về hành động và cảm xúc của
họ, nhưng dữ liệu lớn cho chúng ta biết sự thật.
3-Các nhà lãnh đạo chính trị cần xem xét
thông tin theo hướng nó có thể giúp ích cho toàn xã hội như thế nào, chứ không
phải thông tin cho chúng ta biết điều gì về các cá nhân.
Hãy lấy làm một ly bia, chút mồi, ngồi xuống thư
giãn và tìm hiểu về bí mật của con người!
Bài học 1: Con người không giỏi xác định các mô hình như dữ liệu lớn vì họ không xem xét các kích thước mẫu đủ lớn.
Thuật ngữ dữ liệu lớn đề cập đến lượng thông tin quá lớn đến mức chúng ta cần sức mạnh tính toán khổng lồ để hiểu được thông tin đó.Ví dụ, chúng ta có thể sử dụng tìm kiếm trên Google để xác định các loại thực phẩm phổ biến trong một khu vực. Trên thực tế, điều này khá trực quan, ít nhất là ở một số khía cạnh. Với sự hiểu biết này, tất cả chúng ta đều có thể thấy rằng theo một số cách, chúng ta đều là nhà khoa học dữ liệu.
Chúng ta thích dựa vào trực giác của mình
nhưng nó không thực sự khoa học. Chúng ta thu thập thông tin và cố gắng hiểu
thông tin đó để đưa ra dự đoán, nhưng chúng ta cần phải làm đúng. Khi chúng ta
có dữ liệu phù hợp, chúng ta sẽ có được sự thật để hỗ trợ cho các ý tưởng của
mình và hiểu đúng về cách thế giới vận hành.
Một trải nghiệm mà tác giả có với bà của mình
là một ví dụ điển hình. Bà đã từng cho ông lời khuyên về mối quan hệ, gợi ý tất
cả các đặc điểm cần tìm ở một người bạn đời. Người bạn đời tiềm năng của ông cần
phải hài hước, thông minh và xinh đẹp, chỉ để kể tên một vài đặc điểm.
Nhìn nhận vấn đề này theo góc độ khoa học dữ
liệu, bà chỉ đơn giản là sử dụng 88 năm kinh nghiệm của mình và thông tin mà nó
cung cấp để đưa ra những kết luận này. Trong nhiều năm, bà đã thấy những đặc điểm
của các mối quan hệ thành công và chỉ đơn giản là truyền lại những đặc điểm đó
cho thế hệ sau. Nhưng không phải tất cả các kết luận của bà đều chính xác.
Bà tin chắc rằng để có một mối quan hệ lâu
dài, các cặp đôi nên có nhiều bạn chung. Tuy nhiên, bà đã không lấy thông tin từ
đủ nhiều kinh nghiệm của mọi người.
Nhưng vào năm 2014, một nghiên cứu đã xác định,
với quy mô mẫu đủ lớn từ dữ liệu lớn, rằng nhiều bạn chung trên Facebook khiến
các cặp đôi có nhiều khả năng chia tay hơn.
Bài học 2: Dữ liệu lớn cho chúng ta biết những bí mật đen tối sâu thẳm mà mọi người không muốn chia sẻ.
Một trường đại học gần đây đã yêu cầu sinh
viên trong một cuộc thăm dò chia sẻ GPA của họ. Chỉ có 2% số người tham gia đề
cập đến GPA 2,5 hoặc thấp hơn. Nhưng khi trường kiểm tra hồ sơ chính thức, con
số thực tế cao hơn gấp năm lần con số đó ở mức 11%!
Từ đây có thể thấy khá rõ ràng rằng mọi người
nói dối trong các cuộc khảo sát. Chúng ta làm điều này vì chúng ta muốn trông
thật tốt, ngay cả khi đối mặt với một người mà chúng ta không biết. Điều này
cũng được gọi là thành kiến mong muốn xã hội.
Và mọi người không chỉ nói dối để được yêu
thích. Họ cũng sẽ cố gắng gây ấn tượng với bất kỳ ai hỏi các câu hỏi khảo sát.
Bất kể chúng ta hiểu rõ một người đến mức nào, thành kiến tâm
lý này sẽ chiếm ưu thế và chúng ta sẽ cố gắng tạo ấn tượng tốt.
Hãy nghĩ xem nếu một người trông giống bố bạn
hỏi bạn về việc bạn sử dụng ma túy ở trường đại học. Có lẽ bạn sẽ không muốn
chia sẻ sự thật!
Đây là lý do tại sao các cuộc khảo sát không
đáng tin cậy, nhưng dữ liệu lớn sẽ giúp ích. Những gì chúng ta làm trực tuyến
có vẻ ẩn danh đối với chúng ta, nhưng thông tin thu thập được có thể cho biết
khi nào chúng ta đang nói dối.
Ví dụ, một số cuộc khảo sát hỏi về hành vi
tình dục đã thể hiện điều này một cách hoàn hảo. Số người sẵn sàng thử một số
điều nhất định trong các cuộc khảo sát ít hơn nhiều so với số lượng thực tế hiển
thị dựa trên dữ liệu tìm kiếm từ các trang web!
Bài học 3: Xã hội sẽ tốt đẹp hơn nếu chính phủ sử dụng dữ liệu lớn để xem xét việc giúp đỡ toàn thể xã hội thay vì các cá nhân cụ thể.
Bất cứ khi nào bạn sử dụng Google để tìm kiếm
một cái gì đó, bạn đang cung cấp thông tin của mình cho dữ liệu lớn. Như tôi đã
đề cập ở phần đầu, đây không hẳn là điều xấu, nhưng có những hàm ý mà chúng ta
nên cân nhắc. Ví dụ, nếu chính phủ quyết định tiếp quản thông tin này thì sao?
Ví dụ, nếu mọi người tìm kiếm các cụm từ liên
quan đến tự tử, thì có lẽ nên thông báo cho cảnh sát địa phương, đúng không?
Các con số cho thấy điều này không khả thi. Mỗi
tháng có khoảng 3,5 triệu lượt tìm kiếm các từ liên quan đến tự tử, nhưng thực
tế chỉ có 4.000 vụ tự tử. Việc theo dõi từng lượt tìm kiếm sẽ là sự lãng phí thời
gian và tiền bạc đáng kinh ngạc. Chưa kể đến những hàm ý về mặt đạo đức.
Ví dụ, nghiên cứu chỉ ra rằng các vụ tự tử thực
tế có tương quan với các tìm kiếm trên Google ở cấp
tiểu bang. Sau đó, sở cảnh sát địa phương có thể xác định xem tỷ lệ tìm kiếm
các thuật ngữ này có cao hơn ở tiểu bang của họ hay không. Sử dụng thông tin
đó, họ có thể thực hiện các biện pháp để giảm số vụ tự tử bằng các chương trình
phòng ngừa.
Vì vậy, lần tới khi bạn lo lắng về việc
Google có thông tin của bạn và chính phủ có được thông tin đó, hãy dừng lại và
suy nghĩ. Việc bạn sử dụng internet và cho phép dữ liệu lớn thu thập thông tin
của bạn có thể giúp cứu sống ai đó một ngày nào đó, ít nhất là theo một cách nhỏ.
Đây là một cuốn sách thú vị! Tôi biết thuật
ngữ dữ liệu lớn và có ý tưởng về nó, nhưng tôi không thể tưởng tượng được nó hữu
ích như thế nào. Mọi người đều nói dối thực sự là một cuốn sách mở mang tầm mắt
và có thể giúp chúng ta hiểu rõ hơn một chút về bản chất thực sự của mình.
Nhận xét
Đăng nhận xét