Tóm tắt Everybody Lies Mọi người đều nói dối - Dữ liệu lớn, Dữ liệu mới và những điều Internet tiết lộ về chính chúng ta tác giả Seth Stephens-Davidowitz

Everybody Lies sẽ mở rộng tầm hiểu biết của bạn về bản chất thực sự của con người bằng cách giải thích dữ liệu lớn là gì, nó xuất hiện như thế nào và làm thế nào chúng ta có thể sử dụng nó để hiểu rõ hơn về bản thân mình.

Bạn cảm thấy thế nào khi Google có đầy đủ thông tin về bạn? Tôi có một thành viên trong gia đình từng tin rằng đó là một vấn đề lớn. Anh ấy không sử dụng công cụ tìm kiếm của Google hoặc thậm chí cân nhắc đến việc có tài khoản Gmail!

Mặc dù mọi người đều có quyền lựa chọn những gì họ sẽ và sẽ không sử dụng, nhưng tôi tin rằng việc thu thập thông tin trên internet là một điều tốt. Nó giúp các trang web biết cách tiếp thị tốt hơn cho nhu cầu của chúng ta. Và chúng ta có thể học được rất nhiều điều về bản chất con người khi xem xét dữ liệu và sử dụng dữ liệu đó để cải thiện xã hội.

Dữ liệu lớn, như tên gọi của nó, là một phần quan trọng trong thế giới kỹ thuật số của chúng ta. Hiểu được dữ liệu này rất quan trọng đối với tương lai của chúng ta và cuốn Everybody Lies: Mọi người đều nói dối đã giải thích rất chi tiết về điều đó.

Sau đây là 3 bài học lớn nhất đã mở mang tầm mắt của tôi về con người:

1-Dữ liệu lớn tốt hơn con người trong việc xác định các mô hình trong hành vi của con người vì nó sử dụng các mẫu lớn hơn để đưa ra kết luận.

2-Mọi người nói dối về hành động và cảm xúc của họ, nhưng dữ liệu lớn cho chúng ta biết sự thật.

3-Các nhà lãnh đạo chính trị cần xem xét thông tin theo hướng nó có thể giúp ích cho toàn xã hội như thế nào, chứ không phải thông tin cho chúng ta biết điều gì về các cá nhân.

Hãy lấy làm một ly bia, chút mồi, ngồi xuống thư giãn và tìm hiểu về bí mật của con người!

Bài học 1: Con người không giỏi xác định các mô hình như dữ liệu lớn vì họ không xem xét các kích thước mẫu đủ lớn.

Thuật ngữ dữ liệu lớn đề cập đến lượng thông tin quá lớn đến mức chúng ta cần sức mạnh tính toán khổng lồ để hiểu được thông tin đó.Ví dụ, chúng ta có thể sử dụng tìm kiếm trên Google để xác định các loại thực phẩm phổ biến trong một khu vực. Trên thực tế, điều này khá trực quan, ít nhất là ở một số khía cạnh. Với sự hiểu biết này, tất cả chúng ta đều có thể thấy rằng theo một số cách, chúng ta đều là nhà khoa học dữ liệu.

Chúng ta thích dựa vào trực giác của mình nhưng nó không thực sự khoa học. Chúng ta thu thập thông tin và cố gắng hiểu thông tin đó để đưa ra dự đoán, nhưng chúng ta cần phải làm đúng. Khi chúng ta có dữ liệu phù hợp, chúng ta sẽ có được sự thật để hỗ trợ cho các ý tưởng của mình và hiểu đúng về cách thế giới vận hành.

Một trải nghiệm mà tác giả có với bà của mình là một ví dụ điển hình. Bà đã từng cho ông lời khuyên về mối quan hệ, gợi ý tất cả các đặc điểm cần tìm ở một người bạn đời. Người bạn đời tiềm năng của ông cần phải hài hước, thông minh và xinh đẹp, chỉ để kể tên một vài đặc điểm.

Nhìn nhận vấn đề này theo góc độ khoa học dữ liệu, bà chỉ đơn giản là sử dụng 88 năm kinh nghiệm của mình và thông tin mà nó cung cấp để đưa ra những kết luận này. Trong nhiều năm, bà đã thấy những đặc điểm của các mối quan hệ thành công và chỉ đơn giản là truyền lại những đặc điểm đó cho thế hệ sau. Nhưng không phải tất cả các kết luận của bà đều chính xác.

Bà tin chắc rằng để có một mối quan hệ lâu dài, các cặp đôi nên có nhiều bạn chung. Tuy nhiên, bà đã không lấy thông tin từ đủ nhiều kinh nghiệm của mọi người.

Nhưng vào năm 2014, một nghiên cứu đã xác định, với quy mô mẫu đủ lớn từ dữ liệu lớn, rằng nhiều bạn chung trên Facebook khiến các cặp đôi có nhiều khả năng chia tay hơn.

Bài học 2: Dữ liệu lớn cho chúng ta biết những bí mật đen tối sâu thẳm mà mọi người không muốn chia sẻ.

Một trường đại học gần đây đã yêu cầu sinh viên trong một cuộc thăm dò chia sẻ GPA của họ. Chỉ có 2% số người tham gia đề cập đến GPA 2,5 hoặc thấp hơn. Nhưng khi trường kiểm tra hồ sơ chính thức, con số thực tế cao hơn gấp năm lần con số đó ở mức 11%!

Từ đây có thể thấy khá rõ ràng rằng mọi người nói dối trong các cuộc khảo sát. Chúng ta làm điều này vì chúng ta muốn trông thật tốt, ngay cả khi đối mặt với một người mà chúng ta không biết. Điều này cũng được gọi là thành kiến mong muốn xã hội.

Và mọi người không chỉ nói dối để được yêu thích. Họ cũng sẽ cố gắng gây ấn tượng với bất kỳ ai hỏi các câu hỏi khảo sát. Bất kể chúng ta hiểu rõ một người đến mức nào, thành kiến tâm lý này sẽ chiếm ưu thế và chúng ta sẽ cố gắng tạo ấn tượng tốt.

Hãy nghĩ xem nếu một người trông giống bố bạn hỏi bạn về việc bạn sử dụng ma túy ở trường đại học. Có lẽ bạn sẽ không muốn chia sẻ sự thật!

Đây là lý do tại sao các cuộc khảo sát không đáng tin cậy, nhưng dữ liệu lớn sẽ giúp ích. Những gì chúng ta làm trực tuyến có vẻ ẩn danh đối với chúng ta, nhưng thông tin thu thập được có thể cho biết khi nào chúng ta đang nói dối.

Ví dụ, một số cuộc khảo sát hỏi về hành vi tình dục đã thể hiện điều này một cách hoàn hảo. Số người sẵn sàng thử một số điều nhất định trong các cuộc khảo sát ít hơn nhiều so với số lượng thực tế hiển thị dựa trên dữ liệu tìm kiếm từ các trang web!

Bài học 3: Xã hội sẽ tốt đẹp hơn nếu chính phủ sử dụng dữ liệu lớn để xem xét việc giúp đỡ toàn thể xã hội thay vì các cá nhân cụ thể.

Bất cứ khi nào bạn sử dụng Google để tìm kiếm một cái gì đó, bạn đang cung cấp thông tin của mình cho dữ liệu lớn. Như tôi đã đề cập ở phần đầu, đây không hẳn là điều xấu, nhưng có những hàm ý mà chúng ta nên cân nhắc. Ví dụ, nếu chính phủ quyết định tiếp quản thông tin này thì sao?

Ví dụ, nếu mọi người tìm kiếm các cụm từ liên quan đến tự tử, thì có lẽ nên thông báo cho cảnh sát địa phương, đúng không?

Các con số cho thấy điều này không khả thi. Mỗi tháng có khoảng 3,5 triệu lượt tìm kiếm các từ liên quan đến tự tử, nhưng thực tế chỉ có 4.000 vụ tự tử. Việc theo dõi từng lượt tìm kiếm sẽ là sự lãng phí thời gian và tiền bạc đáng kinh ngạc. Chưa kể đến những hàm ý về mặt đạo đức.

Thay vào đó, nếu chúng ta xem xét cách chúng ta có thể sử dụng dữ liệu khu vực để tác động đến cuộc sống của mọi người theo hướng tốt hơn, chúng ta sẽ có được kết quả khả quan hơn nhiều.

Ví dụ, nghiên cứu chỉ ra rằng các vụ tự tử thực tế có tương quan với các tìm kiếm trên Google ở cấp tiểu bang. Sau đó, sở cảnh sát địa phương có thể xác định xem tỷ lệ tìm kiếm các thuật ngữ này có cao hơn ở tiểu bang của họ hay không. Sử dụng thông tin đó, họ có thể thực hiện các biện pháp để giảm số vụ tự tử bằng các chương trình phòng ngừa.

Vì vậy, lần tới khi bạn lo lắng về việc Google có thông tin của bạn và chính phủ có được thông tin đó, hãy dừng lại và suy nghĩ. Việc bạn sử dụng internet và cho phép dữ liệu lớn thu thập thông tin của bạn có thể giúp cứu sống ai đó một ngày nào đó, ít nhất là theo một cách nhỏ.

Đây là một cuốn sách thú vị! Tôi biết thuật ngữ dữ liệu lớn và có ý tưởng về nó, nhưng tôi không thể tưởng tượng được nó hữu ích như thế nào. Mọi người đều nói dối thực sự là một cuốn sách mở mang tầm mắt và có thể giúp chúng ta hiểu rõ hơn một chút về bản chất thực sự của mình.

Tìm kiếm Blog này

Tổng hợp, cóp nhặt những cuốn sách, kinh nghiệm hay.