Khai thác sức mạnh của LLM: Quan sát từ ChatGPT và UiPath

2023-03-09 22:40:09 237

Các mô hình ngôn ngữ lớn (LLM) như GPT-3 đã cách mạng hóa khả năng máy móc hiểu ngôn ngữ của con người. Được đào tạo trên các bộ dữ liệu có kích thước khổng lồ và độ phức tạp, LLM cuối cùng đã giúp máy tính hiểu và phản hồi các cuộc hội thoại và câu hỏi sắc thái của con người. Thật vậy, điểm chuẩn SuperGLUE cho thấy các LLM mới thường xuyên đánh bại con người về khả năng hiểu ngôn ngữ.

ChatGPT chỉ là một ứng dụng cao cấp của công nghệ này. Các công ty đang bắt đầu sử dụng LLM làm mô hình nền tảng cho nhiều trường hợp sử dụng AI. Các mô hình này có thể nhập một tập dữ liệu lớn, hiểu ý nghĩa của nó và tìm các mẫu hữu ích để chia sẻ lại với doanh nghiệp. Việc nhóm các điểm dữ liệu liên quan lại với nhau được gọi là phân cụm. LLM đã trở nên chính xác đến mức chúng có thể làm điều đó mà không cần bất kỳ đầu vào nào của con người.

Tuy nhiên có một sự cheating ở AI đó là 5% cuối cùng thường bị bỏ qua - model training. Mặc dù độ chính xác và sự hiểu biết của các mô hình này là tuyệt vời, nhưng chúng thường quá chung chung để trở nên hữu ích. Mỗi ngành đều có ngôn ngữ chuyên môn riêng, có những thuật ngữ bạn chỉ có thể học bằng cách đắm mình trong đó.

Giải pháp là đưa con người trở lại. Chỉ các chuyên gia mới có thể hoàn thành chặng đường cuối cùng của quá trình đào tạo mô hình để tùy chỉnh AI theo trường hợp sử dụng chính xác.

Đầu tiên, LLM được cung cấp dữ liệu chuyên biệt và duy nhất của doanh nghiệp. Mô hình tìm các mẫu và đưa ra dự đoán. Tuy nhiên, điều quan trọng là nó chia sẻ những dự đoán mà nó không chắc chắn với con người để xem xét và sửa chữa. Sau đó, con người sẽ kiểm tra hoặc dán các nhãn chính xác cho tập dữ liệu. Điều này giúp mô hình học hỏi từ những sai lầm của nó và tìm hiểu các chi tiết cụ thể của doanh nghiệp mà nó được nhúng vào.

Ý tưởng là tạo ra một vòng phản hồi liên tục với con người ở trung tâm. Họ càng huấn luyện AI nhiều thì nó càng trở nên tốt hơn. Tuy nhiên, quá trình đào tạo cần diễn ra trong một môi trường đơn giản, no code mà bất kỳ ai cũng có thể sử dụng. Bằng cách này, ghi nhãn sẽ trở thành chương trình mới. Nó thay thế nhu cầu lập trình phức tạp, tốn kém.

Chúng ta gọi quá trình này là học tích cực.

Trong tương lai, AI sẽ biến mất hay đúng hơn nó sẽ ẩn dưới background, để con người chiếm vị trí trung tâm một cách hợp lý. AI đơn giản và có mặt khắp nơi đến mức những người sử dụng nó thậm chí sẽ không biết nó ở đó. AI vô hình vận hành các quy trình trong doanh nghiệp, trao quyền cho nhân viên và làm tăng sự hài lòng khách hàng. Nhưng nó vẫn cần con người để làm đúng!