Trong một tài liệu có tên "Phát hiện ngôn ngữ chế nhạo theo ngữ cảnh trên Twitter", các nhà nghiên cứu đến từ trường khoa học máy tính thuộc đại học Carnegie Mellon cho biết họ đã dạy cho những chiếc máy tính cách phát hiện ngôn ngữ chế nhạo dựa trên nhiều yếu tố bao gồm các từ khóa thể hiện sự ngạc nhiên như "clearly", "shocked", "gasp", các từ ngoa dụ như "really" và thậm chí là những hashtag như #lol và #sarcasm. Bên cạnh đó, máy tính cũng phân tích một loạt các yếu tố liên quan như địa chất, tuổi, giới tính và lịch sử giao tiếp của người dùng và giữa người dùng với người được nói đến.
Kết quả cho thấy nam giới sử dụng Twitter tại những múi giờ Mỹ thường có thói quen chế nhạo người khác hơn. Bằng cách kết hợp giữa văn bản và dấu hiệu ngữ cảnh, các nhà nghiên cứu đã có thể dạy cho máy tính đoán được những từ ngữ nào được xem là chế nhạo với tỉ lệ thành công đến 85%. Thêm vào đó, hashtag #sarcasm trên thực tế đã bị hiểu nhầm và nó thường được dùng để củng cố cho một ý kiến mang tính chất chế nhạo hay chỉ ra rằng "người đó đang chế nhạo bạn đấy" cho những người còn lạ lẫm đối với ngôn ngữ châm biếm thay vì mang đúng nghĩ của nó.
Ngoài việc áp dụng để phát hiện lời lẽ chế nhạo trên mạng xã hội thì công nghệ của đại học Carnegie Mellon còn có thể mở đường cho những giải pháp phức tạp hơn để theo dõi và lọc bỏ những loại hình ngôn ngữ mạng nhất định. Điều này có nghĩa máy tính sẽ có thể phân biệt được khi nào một câu nói mang ý nghĩa đùa cợt và khi nào mang nghĩa nghiêm túc. Từ đó, máy tính cũng có thể hiểu rõ hơn về mối quan hệ và ngữ cảnh giữa những người dùng mạng với nhau.
Theo: The Next Web
Không có nhận xét nào:
Đăng nhận xét