Kỷ nguyên báo chí dữ liệu
Xu hướng báo chí hiện đại
Báo chí dữ liệu là một loại hình báo chí đa phương tiện mà ở đó, nhà báo xác minh, sàng lọc, liên kết, phân tích và sắp xếp các dữ liệu thống kê để kể một câu chuyện bằng hình ảnh trực quan, dễ hiểu với độc giả. Từ ý tưởng đến thực tiễn tòa soạn và nhận thức về vai trò quan trọng của dữ liệu, nhiều cơ quan báo chí hàng đầu thế giới đã tiên phong xây dựng các thuật toán đề xuất tin bài, tùy chỉnh trang tin cho từng độc giả và thậm chí thử nghiệm các hình thức truyền tải mới dựa trên dữ liệu thu thập được.
![]() |
Dữ liệu lớn và cá nhân hóa nội dung chính là “chìa khóa” tương lai của báo chí. |
Theo các tài liệu nghiên cứu, The New York Times (Mỹ) những năm gần đây đã chuyển mình mạnh mẽ nhờ chiến lược dữ liệu. Từ năm 2013, tờ báo này đã ra mắt mục “Recommended for you” (Gợi ý cho bạn) trên website, cung cấp tin bài dựa theo lịch sử đọc của từng người dùng. Sau một thời gian thử nghiệm, tờ báo thiết lập hẳn một đội ngũ Personalization team (đội chuyên trách cá nhân hóa) nhằm tạo ra trải nghiệm ngày càng lấy độc giả làm trung tâm.
Đến năm 2019, The New York Times giới thiệu tính năng “For you” trên ứng dụng tin tức di động của mình (một hub nội dung cá nhân hóa hiển thị ngay trang chủ ứng dụng dành cho người dùng đã đăng ký). Thay vì chỉ dựa trên thuật toán hành vi thuần túy, tờ báo này cho phép độc giả chủ động chọn chủ đề yêu thích trong phần cài đặt (bao gồm cả từ khóa, chuyên mục và cây bút mà họ quan tâm). Dựa trên những lựa chọn đó kết hợp với thuật toán, mục “For you” sẽ hiển thị các bài viết phù hợp nhất một cách nổi bật ngay bên cạnh dòng tin thời sự chính. Mục tiêu của tính năng này là tăng thời gian độc giả tương tác và cải thiện tỷ lệ giữ chân độc giả, qua đó gián tiếp thúc đẩy chuyển đổi người đọc thành người đăng ký.
Một điển hình về tiên phong ứng dụng Dữ liệu lớn là The Washington Post (Mỹ). Sau khi về với Amazon, tờ báo đã đầu tư mạnh vào công nghệ để “may đo” trải nghiệm tin tức cho bạn đọc. Ngoài hệ thống gợi ý tin bài Clavis (giúp tăng gần gấp đôi lượt độc giả click vào bài gợi ý), Washington Post còn triển khai công cụ bandito (một nền tảng thử nghiệm nội dung theo thời gian thực do chính đội ngũ kỹ thuật của báo phát triển) cho phép các biên tập viên tạo ra nhiều phiên bản khác nhau của cùng một bài viết (với tiêu đề, ảnh minh họa, tóm tắt khác nhau) và tự động phân phối ngẫu nhiên cho các nhóm độc giả khác nhau trong thời gian đầu đăng tải.
Dựa trên dữ liệu phản hồi tức thì của độc giả (phiên bản nào được click nhiều hơn, đọc lâu hơn), thuật toán sẽ tự động chọn ra phiên bản tối ưu và hiển thị phiên bản đó nhiều hơn. Đặc biệt, bandito còn xét đến các tín hiệu cá nhân hóa: Ví dụ độc giả quốc tế có thể phản ứng khác độc giả địa phương, người truy cập từ mạng xã hội có hành vi khác người truy cập trực tiếp. Hệ thống sẽ tự động tối ưu trải nghiệm trình bày bài báo dựa trên kênh truy cập, loại thiết bị, thời gian trong ngày và nhiều yếu tố khác của từng nhóm độc giả.
Đây là bước tiến lớn so với cách biên tập truyền thống “một phiên bản cho tất cả”, đảm bảo mỗi độc giả được tiếp cận nội dung theo cách hiệu quả nhất đối với họ. Bên cạnh đó, Washington Post phát triển mục “My Post” - cho phép người dùng theo dõi những chủ đề hoặc tác giả ưa thích và cá nhân hóa nội dung hiển thị tương ứng. Những nỗ lực này cho thấy tòa soạn đã rất thành công trong việc “may đo” tin tức theo sở thích người đọc, giúp Washington Post giữ vững lượng truy cập và đăng ký cao trong môi trường cạnh tranh.
Cũng không nằm ngoài xu hướng, dù cách tiếp cận có phần thận trọng và đặt nặng tính trách nhiệm công chúng, BBC (Anh) ngay từ năm 2015, đã đề ra chiến lược “myBBC” với mục tiêu cung cấp dịch vụ số được cá nhân hóa cho khán giả trên mọi nền tảng. BBC khuyến khích người dùng tạo tài khoản BBC ID và đăng nhập khi sử dụng dịch vụ; điều này cho phép hệ thống thu thập dữ liệu về nội dung đã xem/nghe và về vị trí địa lý, chủ đề ưa thích của từng cá nhân.
Năm 2016, BBC ra mắt ứng dụng BBC+ (một ứng dụng tổng hợp cá nhân hóa, tích hợp cả tin tức, video, radio, thể thao...) nhằm giúp khán giả dễ dàng tiếp cận mọi nội dung của BBC. Ứng dụng này sử dụng dữ liệu từ BBC ID để đề xuất nội dung mà người dùng có thể quan tâm dựa trên danh mục họ chọn khi đăng ký, vị trí của họ, cũng như những gì họ đã xem/nghe trước đó. Chẳng hạn, một người dùng đăng nhập có thể thấy nổi bật trên trang chủ ứng dụng các bản tin thời sự địa phương (dựa trên vị trí), tin tức về đội bóng mà họ theo dõi (dựa trên tùy chọn cá nhân), bên cạnh những tin quan trọng do biên tập viên BBC lựa chọn.
Điểm đáng chú ý là BBC kết hợp giữa thuật toán và biên tập viên: Ngoài gợi ý máy móc, BBC+ vẫn có các khuyến nghị do đội ngũ biên tập phụ trách, đảm bảo những tin tức quan trọng nhất vẫn được chuyển tải đến công chúng một cách phù hợp. Bên cạnh ứng dụng, BBC cũng đẩy mạnh việc đăng nhập trên trang tin, cho phép cá nhân hóa nội dung trên website và theo dõi thị hiếu người dùng. Tính đến năm 2024, đã có 23,5 triệu người dùng tại Anh đăng nhập sử dụng các sản phẩm số của BBC. Đó là một minh chứng cho thấy công chúng sẵn sàng trao dữ liệu cá nhân để đổi lấy trải nghiệm nội dung tốt hơn.
Hòa vào dòng chảy báo chí hiện đại, báo chí Việt Nam cũng không đứng ngoài xu hướng này. Trong những năm gần đây, nhiều cơ quan báo chí trong nước đã bắt đầu đầu tư vào hạ tầng dữ liệu và thử nghiệm cá nhân hóa nội dung nhằm nâng cao trải nghiệm bạn đọc.
Đòi hỏi tất yếu của phát triển
Qua các nghiên cứu, đánh giá có thể thấy độc giả ngày nay, nhất là thế hệ trẻ lớn lên cùng công nghệ, luôn kỳ vọng nội dung được tùy biến theo nhu cầu và sở thích cá nhân, tương tự như những trải nghiệm số khác trong cuộc sống. Thực tế này đặt ra thách thức lớn cho các cơ quan báo chí: Nếu không thích ứng và cung cấp trải nghiệm mang tính cá nhân hóa, họ có nguy cơ đánh mất độc giả vào tay các nền tảng số và mạng xã hội vốn luôn “thấu hiểu” người dùng. Đặc biệt, trong bối cảnh thông tin bùng nổ, mỗi người có vô vàn lựa chọn nội dung mỗi ngày. Mô hình truyền thông đại chúng một chiều đã trở nên lỗi thời. Thay vào đó, cá nhân hóa nội dung đang nổi lên như một xu hướng tất yếu và sẽ sớm trở thành cuộc cách mạng trong ngành truyền thông.
Các chuyên gia dự báo đến năm 2025, cá nhân hóa sẽ chuyển từ “tốt thì có” sang “bắt buộc phải có” đối với các tổ chức báo chí . Với sự hỗ trợ của công nghệ dữ liệu lớn, báo chí có cơ hội đổi mới cách tiếp cận độc giả, cung cấp nội dung đáp ứng cho từng cá nhân, qua đó tăng cường gắn kết và nâng cao hiệu quả phục vụ thông tin.
![]() |
Cá nhân hóa nội dung đang nổi lên như một xu hướng tất yếu và sẽ sớm trở thành cuộc cách mạng trong ngành truyền thông. |
Theo giáo trình về đào tạo báo chí, truyền thông, dữ liệu lớn là thuật ngữ đề cập đến việc xử lý một tập hợp dữ liệu rất lớn và phức tạp mà các ứng dụng xử lý dữ liệu truyền thống không xử lý được. Dữ liệu lớn bao gồm việc phân tích, thu thập, giám sát dữ liệu, tìm kiếm, chia sẻ, lưu trữ, truyền nhận, trực quan, truy vấn và tính riêng tư. Công nghệ này đang trở thành “bệ phóng” cho đổi mới báo chí.
Trước đây, các quyết định biên tập chủ yếu dựa trên kinh nghiệm và cảm quan, thì nay dữ liệu lớn cung cấp cái nhìn định lượng về hành vi và thị hiếu của độc giả. Mỗi lượt xem, mỗi cú click, thời gian đọc, chia sẻ trên mạng xã hội… đều để lại “dấu vết” dữ liệu quý giá. Việc khai thác những tập dữ liệu khổng lồ về hành vi, sở thích và mối quan tâm của độc giả cho phép các tòa soạn thấu hiểu sâu sắc đối tượng của mình. Chẳng hạn, nhờ phân tích dữ liệu lớn bằng AI, hệ thống có thể dự đoán loại nội dung mà một người dùng cụ thể sẽ quan tâm dựa trên lịch sử tương tác của họ.
Dữ liệu lớn không chỉ giúp nhận diện đề tài thu hút độc giả, mà còn hỗ trợ báo chí tùy biến cách kể chuyện. Các tòa soạn lớn đã bắt đầu tận dụng dữ liệu để trả lời những câu hỏi như: Độc giả quan tâm chủ đề gì? thời điểm nào họ đọc nhiều nhất? hình thức nội dung (tin ngắn, bài phân tích, video…) nào hiệu quả? Chẳng hạn, tờ Washington Post đã phát triển công cụ Clavis sử dụng xử lý ngôn ngữ tự nhiên để phân tích nội dung từng bài báo và gắn thẻ chủ đề, từ khóa phù hợp. Song song, Clavis theo dõi lịch sử đọc của từng người dùng trên trang, từ đó ghép nối bạn đọc với những bài viết có chủ đề phù hợp với sở thích cá nhân của họ. Kết quả là: Washington Post ghi nhận tỷ lệ bạn đọc click vào mục “Đề xuất cho bạn” (Post Recommends) tăng 95% chỉ sau một năm ứng dụng hệ thống gợi ý nội dung cá nhân hóa này. Đây là minh chứng rõ ràng cho thấy phân tích dữ liệu lớn có thể nâng cao mức độ tương tác và giữ chân độc giả ở lại lâu hơn với sản phẩm báo chí.
Không chỉ dừng ở việc tăng lượng truy cập, Dữ liệu lớn còn tác động tích cực đến mô hình kinh doanh báo chí. Bằng cách hiểu rõ độc giả muốn gì và phục vụ đúng thứ họ cần, các tòa soạn có thể chuyển đổi độc giả trung thành thành người đăng ký trả phí hay hội viên. Mục tiêu cuối cùng của cá nhân hóa nội dung là tăng cường gắn kết và duy trì độc giả, mà như kinh nghiệm của The New York Times, đây chính là tiền đề để chuyển đổi người đọc miễn phí thành thuê bao trả tiền. Khi độc giả cảm thấy trang báo luôn cung cấp những thông tin phù hợp và hữu ích cho riêng họ, họ sẵn sàng trả phí để duy trì trải nghiệm đó. như vậy, dữ liệu lớn và cá nhân hóa không chỉ hỗ trợ nghiệp vụ biên tập mà còn mở ra hướng đi mới giúp báo chí phát triển bền vững trong kỷ nguyên số.
Theo giáo trình về đào tạo báo chí, truyền thông, dữ liệu lớn là thuật ngữ đề cập đến việc xử lý một tập hợp dữ liệu rất lớn và phức tạp mà các ứng dụng xử lý dữ liệu truyền thống không xử lý được. Dữ liệu lớn bao gồm việc phân tích, thu thập, giám sát dữ liệu, tìm kiếm, chia sẻ, lưu trữ, truyền nhận, trực quan, truy vấn và tính riêng tư. Công nghệ này đang trở thành “bệ phóng” cho đổi mới báo chí. Trước đây, các quyết định biên tập chủ yếu dựa trên kinh nghiệm và cảm quan, thì nay dữ liệu lớn cung cấp cái nhìn định lượng về hành vi và thị hiếu của độc giả. Mỗi lượt xem, mỗi cú click, thời gian đọc, chia sẻ trên mạng xã hội… đều để lại “dấu vết” dữ liệu quý giá. |
Có thể bạn quan tâm
Nên xem

Chủ tịch Hồ Chí Minh: Người đặt nền móng Báo chí cách mạng Việt Nam

Nhận định Inter Milan vs Urawa Red Diamonds: Cuộc chiến sinh tử

Tạm giữ nhiều đối tượng gây rối trật tự công cộng tại Đồng Nai

U21 Tây Ban Nha vs U21 Anh: Màn tái ngộ định đoạt giấc mơ vô địch

Giá xăng dầu hôm nay (21/6): Giá dầu thế giới quay đầu giảm

U21 Bồ Đào Nha vs U21 Hà Lan: Tứ kết định mệnh

Dortmund vs Mamelodi Sundowns: “Báo đen” liệu có tìm lại bản năng hủy diệt?
Tin khác

Đổi mới sáng tạo là “chìa khóa” thành công
Chuyển đổi số 21/06/2025 05:43

Để báo chí bắt kịp “chuyến tàu” AI
Chuyển đổi số 20/06/2025 14:42

Công an Thủ đô làm chủ khoa học công nghệ, vững bước tiến vào kỷ nguyên số
Chuyển đổi số 08/06/2025 15:48

Kể chuyện đa phương tiện: Thay đổi cách nhìn nhận về sản phẩm báo chí
Chuyển đổi số 04/06/2025 20:38

Đẩy mạnh số hóa, mang lại tiện ích tối đa cho người dân
Chuyển đổi số 03/06/2025 17:55

Chuyển đổi số trong đăng ký xe, người dân Hà Nội chỉ mất vài phút làm thủ tục
Chuyển đổi số 29/05/2025 14:56

Tạo cơ hội để doanh nghiệp công nghệ số phát triển đột phá
Xã hội 27/05/2025 17:20

100% cơ sở khám chữa bệnh BHYT đã tiếp nhận đăng ký thủ tục bằng Căn cước công dân
Chuyển đổi số 24/05/2025 14:47

Siết chặt SIM rác, tài khoản ảo: Đánh mạnh vào tội phạm công nghệ cao
Chuyển đổi số 22/05/2025 08:49

Ứng dụng trí tuệ nhân tạo trong quản trị tòa soạn thông minh
Chuyển đổi số 15/05/2025 12:44