Dùng mạng xã hội để đánh giá ô nhiễm

ThienNhien.Net – Bằng việc phân tích các thông tin đăng tải trên mạng xã hội Sina Weibo, các nhà nghiên cứu khoa học máy tính thuộc Đại học Wisconsin-Madison đã phát triển một phương pháp mới để đánh giá tình trạng ô nhiễm không khí ở Trung Quốc với tính chính xác tương đối cao.

Nhóm gồm ba nghiên cứu sinh Trung Quốc Shike Mei, Han Li và Jing Fan đã phân tích các bài viết trên Sina Weibo – mạng xã hội phổ biến nhất ở Trung Quốc hiện nay – để khám phá thông tin thời gian thực về mức độ ô nhiễm không khí ở các thành phố của Trung Quốc.

Các nghiên cứu sinh đã theo dõi những bài viết đăng tải trên Weibo từ 108 thành phố của Trung Quốc trong vòng 30 ngày để xem cộng đồng thường xuyên phàn nàn như thế nào về tình trạng không khí.

Tiếp đó, nhóm nghiên cứu tiến hành phân tích nội dung các bài viết, mối tương quan giữa không gian và thời gian giữa các thành phố cũng như giữa các ngày với nhau bởi vì ô nhiễm không khí thường diễn ra trên diện rộng ở nhiều thành phố và kéo dài trong nhiều ngày.

Mặc dù phương pháp này không thể dự đoán chất lượng không khí trong tương lai nhưng có thể cung cấp một cách chính xác và tức thời thông tin về Chỉ số chất lượng không khí (Air Quality Index – AQI).

Nhiều người phàn nàn về tình trạng ô nhiễm không khí trên Weibo (Ảnh minh họa: urbanemissions.blogspot.com)
Nhiều người phàn nàn về tình trạng ô nhiễm không khí trên Weibo (Ảnh minh họa: urbanemissions.blogspot.com)

Theo Tạp chí Y khoa The Lancet, ô nhiễm không khí là nguyên nhân của khoảng 350.000 đến 500.000 ca tử vong sớm mỗi năm ở Trung Quốc. Mặc dù tỷ lệ người hút thuốc đã giảm nhưng số bệnh nhân ung thư phổi của quốc gia này vẫn gia tăng. Hiện các thành phố lớn ở Trung Quốc đã có các trạm quan trắc để đánh giá mức độ ô nhiễm không khí, nhưng các thành phố nhỏ hơn thường không có kinh phí để xây dựng và duy trì các trạm quan trắc kiểu này.

Nhóm nghiên cứu không dùng các mô hình toán học sử dụng các từ khóa chọn trước để phân tích các thông tin đăng tải trên Weibo. Thay vào đó, nhóm đã phát triển một mô hình máy tính để gán các trọng số khác nhau cho những từ khác nhau sử dụng trong mỗi bài viết.

Biện pháp phân tích dữ liệu công khai của nhóm nghiên cứu có thể áp dụng cho một loạt các vấn đề khác – giáo sư Jerry Zhu và Chuck Dyer, những người cùng đồng hành cùng nhóm nghiên cứu nhận định.