Lê Ngọc Vân


Tại sao Tweet không thể là phương tiện dùng để đo tuổi khi qua tuổi 30

Dường như tuổi 30 là tuổi mà mọi người trưởng thành qua Twitter. Computer cho thấy gần như là bất khả thi trong cố gắng đoán tuổi của dân trên mạng khi phân tích dạng ngôn ngữ họ dùng một khi họ qua tuổi 20, những nghiên cứu gia ở Hà Lan đã nhận thấy như vậy.

Họ nghiệm ra rằng trong khi phần mềm của họ có thể đưa ra một cố gắng đáng tin trong việc đoán tuổi của tweeter nếu người này trong hạn tuổi từ 17 đến 30, thì nó lại gặp nhiều khó khăn trong việc định tuổi của những người thuộc lứa tuổi cao hơn. Họ thấy rằng ngôn ngữ được dùng trong tin nhắn với phạm vi 140 mẫu tự của Twitter gần như không thay đổi khi người ta già đi, đã khiến cho việc đoán tuổi của những người trên 30 trở thành vô dụng.

Toán nghiên cứu, do Dong Nguyen của đại học Twente chỉ đạo, đã khảo sát 3000 tài khoản Twitter của Hà Lan trong nỗ lực khám phá ra tuổi của những chủ tài khoản này. Phần mềm hành xử tốt hơn và nhanh hơn con người trong việc đoán tuổi chính xác, nhưng sai số trung bình là 4 tuổi đâm ra vô dụng. “Chúng tôi tìm thấy những thay đổi lớn lao trong mức tuổi thấp, tuy nhiên sau khoảng 30 thì phần lớn chỉ cho thấy thay đổi rất ít,” những người trong nhóm cho biết như vậy trong bài viết của họ.

Bước ngoặt của ngôn ngữ vào độ tuổi ba mươi dường như có mối liên hệ đến sự chuyển đổi: từ lối dùng từ ngữ rườm rà với nhiều chữ hoa và chữ tắt, sang lối dùng ngôn từ phức tạp hơn, mà những người trong nhóm nghiên cứu cho là “sự thu xếp tư tưởng” dần dần trở nên quan trọng hơn cho những người đã đi vào chuyên môn. Cách dùng câu chữ của họ bao hàm những hàng tweet dài hơn, chọn những từ dài hơn, cho thêm nhiều nối kết.

Những luật sư tư nhân sẽ hoàn toàn tán thành những phát kiến này, nhưng có những cách khác để đoán ra những yếu tố người ta thường che dấu khi tham gia những mạng xã hội, như tuổi tác, giới tính hay công việc. Thí dụ, vào năm 2007, phòng thí nghiệm của Microsoft ở Bắc Kinh đã tiết lộ những dấu vết để lại khi truy cập mạng có thể phanh phui hết mọi chuyện ra sao. Và những mạng như Facebook, khi cho phép gửi những tin nhắn dài hơn Twitter, có thể cho người ta biết về bạn nhiều hơn là đoán tuổi.

 

Nguyên tác: Why tweets from the over-30s are no measure of age, Paul Marks
Lê Ngọc Vân dịch

(Trích từ New Scientist, 10/04/2013)

________

Ðể tìm thêm dữ kiện nhằm cải tiến chương trình computer đoán tuổi qua twitter, Dong Nguyen và các bạn đã mở ra mạng http://www.tweetgenie.nl/ được nhiều twitter vào thăm để thử cho computer tự động đoán tuổi qua mạng này.

 


Cái Đình - 2013