Công nghệ xử lý ngôn ngữ tự nhiên (NLP) là một nhánh của trí tuệ nhân tạo, giúp máy tính có khả năng diễn giải, phân tích, xử lý và thấu hiểu ngôn ngữ của con người. Ngay từ khi được sinh ra, con người đã bắt đầu quá trình xử lý ngôn ngữ của mình. Phải mất nhiều năm luyện tập một (hoặc một vài) loại ngôn ngữ phức tạp mới có thể hiểu đúng. Thậm chí, có rất nhiều thành ngữ, tiếng lóng, tiếng địa phương vô cùng mơ hồ, những người không thường xuyên tiếp xúc hầu như không thể hiểu được.
Và bằng cách nào đó, robot dường như đã làm chủ được ngôn ngữ. Giờ đây, người ta có thể yêu cầu ChatGPT viết một bài thơ dài nhiều khổ, đa dạng ngôn ngữ hoặc bất kỳ dạng nội dung nào để đăng tải trên mạng xã hội chỉ trong vài giây.
Vậy, làm thế nào máy móc có thể hiểu được ngôn ngữ của con người? Nó liên quan đến một thứ gọi là xử lý ngôn ngữ tự nhiên (NLP – Natural language processing) – quy trình cho phép ứng dụng trí tuệ nhân tạo (AI – Artificial Intelligence) hiểu ngôn ngữ bằng cách phân tích, xử lý với hàng tỷ quy tắc tự “học” khác nhau.
Xử lý ngôn ngữ tự nhiên (NLP) là gì?
Xử lý ngôn ngữ tự nhiên là một phần quan trọng của trí tuệ nhân tạo và khoa học máy tính, cho phép máy móc hiểu và suy luận ý nghĩa từ ngôn ngữ của con người.
Về cơ bản, NLP là quá trình AI được dạy để hiểu quy tắc, cú pháp của ngôn ngữ, đồng thời máy móc được lập trình giúp phát triển các thuật toán phức tạp, nhằm biểu diễn những quy tắc đã học. Sau đó, chúng áp dụng thuật toán để thực hiện tác vụ cụ thể.
NLP kết hợp ngôn ngữ học tính toán, mô hình hóa ngôn ngữ con người dựa trên quy tắc với các mô hình thống kê, học máy (machine learning) và học sâu (deep learning).
Cùng với nhau, những công nghệ này cho phép máy tính xử lý ngôn ngữ của con người dưới dạng dữ liệu văn bản hoặc giọng nói và ‘hiểu’ ý nghĩa đầy đủ, hoàn chỉnh với ý định và tình cảm của người nói hoặc người viết.
NLP thúc đẩy chương trình máy tính dịch văn bản từ ngôn ngữ này sang ngôn ngữ khác, phản hồi lệnh được yêu cầu và tóm tắt khối lượng lớn văn bản một cách nhanh chóng, ngay cả trong thời gian thực.
Công nghệ xử lý ngôn ngữ tự nhiên được sử dụng phổ biến. Rất có thể bạn đã tương tác với NLP dưới dạng hệ thống GPS điều khiển bằng giọng nói, trợ lý kỹ thuật số, phần mềm chuyển lời nói thành văn bản, chatbot dịch vụ khách hàng và các tiện ích khác cho người tiêu dùng.
Bên cạnh đó, NLP cũng đóng một vai trò ngày càng quan trọng đối với doanh nghiệp, giúp hợp lý hóa hoạt động kinh doanh, tăng năng suất của nhân viên và đơn giản hóa một số quy trình kinh doanh quan trọng.
Nhiệm vụ của NLP – Xử lý ngôn ngữ tự nhiên
Ngôn ngữ của con người có rất nhiều điểm khó hiểu, khiến cho việc tạo nên phần mềm có khả năng nắm bắt chính xác ý nghĩa mong muốn truyền tải của dữ liệu văn bản hoặc giọng nói là vô cùng khó khăn.
Từ đồng âm, đồng nghĩa, châm biếm, thành ngữ tục ngữ, phép ẩn dụ, ngữ pháp, biến thể trong cấu trúc câu,… chỉ là một vài trong số những điểm “bất thường” của ngôn ngữ loài người mà chính con người cũng phải mất rất nhiều năm mới học được.
Hiện tại, với NLP, máy tính đã có khả năng:
- Tạo ngôn ngữ (Language generation): Các ứng dụng AI tạo văn bản mới dựa trên yêu cầu hoặc ngữ cảnh nhất định, chẳng hạn như tạo văn bản cho chatbot, trợ lý ảo hoặc thậm chí là sáng tạo nội dung.
- Trả lời câu hỏi: Các ứng dụng AI giải đáp thắc mắc của người dùng bằng ngôn ngữ phù hợp về một chủ đề cụ thể nào đó.
- Nhận dạng giọng nói: Đây là nhiệm vụ chuyển đổi dữ liệu giọng nói thành dữ liệu văn bản một cách đáng tin cậy. Nhận dạng giọng nói cũng rất cần thiết cho ứng dụng tuân theo khẩu lệnh hoặc trả lời câu hỏi bằng giọng nói.
- Gắn thẻ ngữ pháp và định hướng nghĩa của từ: Là quá trình xác định ý nghĩa của một từ hoặc đoạn văn bản cụ thể dựa trên cách sử dụng và ngữ cảnh của nó.
- Độ phân giải đồng tham chiếu: Xác định nếu và khi nào hai từ đề cập đến cùng một thực thể.
- Phân tích tình cảm: Ứng dụng trí tuệ nhân tạo có khả năng phân tích văn bản để xác định tình cảm hoặc giai điệu cảm xúc của người viết, chẳng hạn như văn bản thể hiện tình cảm tích cực, tiêu cực hay trung lập.
- Phân loại văn bản: AI phân loại văn bản thành nhiều danh mục hoặc chủ đề khác nhau, chẳng hạn như phân loại các bài báo theo nội dung chính trị, thể thao hoặc giải trí.
- Dịch máy: AI dịch văn bản từ ngôn ngữ này sang ngôn ngữ khác vô cùng nhanh chóng với mức độ chính xác cao.
Đây chỉ là một vài nhiệm vụ chính mà AI thực hiện được nhờ tích hợp công nghệ xử lý ngôn ngữ tự nhiên. Nhưng làm thế nào để AI đạt đến mức có thể làm được những điều này?
NPL hoạt động như thế nào?
Trước khi có thể thực hiện bất kỳ tác vụ nào, máy cần hiểu ngôn ngữ hoạt động như thế nào. Điều này được thực hiện thông qua một quy trình gọi là học máy. Trong đó, con người cung cấp cho nó một lượng lớn dữ liệu đào tạo hoặc ví dụ về ngôn ngữ được sử dụng trong mọi ngữ cảnh có khả năng xảy ra.
Nổi bật nhất thời gian gần đây, ChatGPT – chatbot của OpenAI, đã được cung cấp hơn nửa nghìn tỷ từ ngữ thông qua sách, văn bản, bài báo và dữ liệu trên web mở.
Tuy nhiên, không phải cứ nhồi nhét dữ liệu cho máy tính là xong. Trong khi các từ và câu có ý nghĩa đối với con người, thì đối với máy tính, chúng chỉ là chuỗi văn bản. Để AI có thể hiểu được, người huấn luyện máy tính phải gắn nhãn dữ liệu và giúp máy tính học cách hiểu ngôn ngữ, quy tắc và quy ước, cũng như cách phân tích ngôn ngữ đó. Điều này được thực hiện nhờ sử dụng các kỹ thuật xử lý ngôn ngữ tự nhiên.
Khi học ngôn ngữ, con người cũng thực hiện phân tích cú pháp: Tách thành phần câu và xác định chủ ngữ, vị ngữ, tân ngữ, động từ, trạng từ, tính từ,… Tương tự, máy tính cũng được dạy tách một câu hoặc một từ ra để hiểu cách thức hoạt động của cú pháp, mối quan hệ giữa các từ, ý nghĩa được suy ra và tất cả những khía cạnh khác của ngôn ngữ. Những kỹ thuật này thường liên quan đến:
- Tokenization: Văn bản được chia thành đơn vị ngữ nghĩa nhỏ hơn.
- Gắn thẻ một phần (Part-of-speech-tagging): Từ được phân loại thành danh từ, động từ, tính từ và nhiều phần khác.
- Biến đổi từ về dạng gốc (Stemming): Từ được giảm xuống dạng cơ bản hoặc gốc của chúng.
- Quản lý đối thoại (Dialogue management): AI xem xét, xác định bối cảnh thực tế của cuộc đối thoại.
Khi máy tính nắm bắt được những kỹ thuật này, nó có thể chuyển đổi kiến thức ngôn ngữ của mình thành các thuật toán học sâu. Sau đó, ngoài khả năng đọc và hiểu văn bản, nó còn có thể tự viết ra văn bản của chính mình. Ở giai đoạn này, người huấn luyện thường tinh chỉnh mô hình bằng phản hồi và học tăng cường, để AI tạo ra kết quả tốt nhất.
Tóm lại, cách thức hoạt động NLP diễn ra như sau:
- Máy tính được cung cấp một lượng lớn dữ liệu huấn luyện.
- Con người gắn nhãn dữ liệu này bằng quy tắc ngôn ngữ và dạy nó kỹ thuật xử lý ngôn ngữ tự nhiên.
- Sau đó, máy tính sử dụng các kỹ thuật này để phát triển thuật toán học sâu, tạo thành cơ sở cho mô hình ngôn ngữ của nó.
- Người huấn luyện tinh chỉnh mô hình bằng phản hồi củng cố.
Trường hợp ứng dụng NLP trong thực tiễn
Xử lý ngôn ngữ tự nhiên là “vũ khí” đằng sau trí thông minh của máy tính trong nhiều ứng dụng hiện đại ở thế giới thực ngày nay. Dưới đây là một vài ví dụ:
Phát hiện thư rác
Tưởng chừng không liên quan nhưng công nghệ phát hiện thư rác tốt nhất hiện nay sử dụng khả năng phân loại văn bản của NLP, quét email để tìm ngôn ngữ thường xuất hiện trong thư rác hoặc tin lừa đảo.
Những dấu hiệu nhận biết bao gồm việc sử dụng quá nhiều thuật ngữ tài chính, sai ngữ pháp đặc trưng, ngôn ngữ đe dọa, mức độ khẩn cấp không phù hợp, tên công ty viết sai chính tả,…
Phát hiện thư rác là một trong số ít vấn đề NLP có thể xử lý mà các chuyên gia coi là “được giải quyết gần hết” (mặc dù còn nhiều tranh luận, cho rằng điều này không hoàn toàn phù hợp với trải nghiệm sử dụng email của họ).
Dịch máy
Google Dịch là một ví dụ về công nghệ NLP phổ biến, được sử dụng rộng rãi. Bản dịch hiệu quả phải nắm bắt chính xác ý nghĩa và giọng điệu của ngôn ngữ đầu vào và chuyển đổi nó thành văn bản có cùng ý nghĩa, tác động mong muốn trong ngôn ngữ đầu ra.
Các công cụ dịch máy đang đạt được tiến bộ tốt về độ chính xác. Một cách tuyệt vời và dễ dàng nhất để kiểm tra bất kỳ công cụ dịch máy nào là dịch văn bản sang một ngôn ngữ rồi dịch quay lại bản gốc.
Tác nhân ảo và chatbot
Tác nhân ảo (Virtual agents) như Siri của Apple và Alexa của Amazon sử dụng tính năng nhận dạng giọng nói, so sánh với mẫu trong lệnh thoại và tạo ngôn ngữ tự nhiên để phản hồi bằng hành động phù hợp hoặc nhận xét hữu ích.
Chatbot thực hiện hoạt động tương tự để đáp lại những yêu cầu, câu hỏi bằng văn bản. Chatbot hiểu ngôn ngữ của con người theo từng ngữ cảnh và cung cấp phản hồi/tùy chọn phù hợp nhất.
Cải tiến tiếp theo cho ứng dụng này là khả năng trả lời câu hỏi – có thể đoán trước hoặc không – với những đáp án phù hợp và hữu ích theo cách riêng của chúng.
Phân tích tình cảm trên mạng xã hội
NLP đã trở thành một công cụ kinh doanh thiết yếu để khám phá những hiểu biết sâu sắc về dữ liệu tiềm ẩn từ nhiều nguồn kênh truyền thông xã hội. Phân tích tình cảm có thể nhận diện ngôn ngữ được sử dụng trong các bài đăng, phản hồi, đánh giá trên mạng xã hội,…
Sau đó, máy tính trích xuất thái độ và cảm xúc đối với sản phẩm, chương trình khuyến mãi và sự kiện, cung cấp thông tin mà công ty có thể sử dụng trong sáng tạo, cải thiện sản phẩm, xây dựng chiến dịch quảng cáo,…
Tóm tắt văn bản
Tóm tắt văn bản sử dụng kỹ thuật NLP để xử lý khối lượng lớn văn bản kỹ thuật số và tạo bản tóm tắt. Chỉ mục, cơ sở dữ liệu, tài liệu nghiên cứu được tóm tắt ngắn gọn cho những người bận rộn, không có thời gian để đọc toàn văn.
Các ứng dụng tóm tắt văn bản hiệu quả nhất sử dụng lập luận ngữ nghĩa và tạo ngôn ngữ tự nhiên (NLG – Natural language generation) để thêm ngữ cảnh và kết luận hữu ích vào phần tóm tắt.
Công nghệ xử lý ngôn ngữ tự nhiên giúp con người giao tiếp với máy tính dễ dàng, nhanh chóng, đồng thời, máy tính cũng tích hợp công nghệ này để hỗ trợ con người thực hiện nhiều tác vụ một cách nhanh chóng, dễ dàng hơn bao giờ hết.