GenAI được đào tạo để xử lý tài liệu: Thúc đẩy hoạt động kinh doanh trên quy mô lớn

GenAI được đào tạo để xử lý tài liệu: Thúc đẩy hoạt động kinh doanh trên quy mô lớn

2024-05-03 11:05:39 162

Chúng ta đang nhanh chóng hướng tới một thế giới nơi văn phòng hỗ trợ gần như hoàn toàn tự động. Hãy xem xét: Gartner dự đoán rằng trong vòng một năm, một nửa số hóa đơn B2B sẽ được thanh toán mà không cần can thiệp thủ công, tiếp tục tăng lên 80% vào năm 2030 .

Nghiên cứu gần đây cho thấy rằng, ngày nay, 57% dữ liệu hóa đơn vẫn cần nhập thủ công. Đó là bởi vì tốc độ, công suất, tiết kiệm chi phí và độ chính xác mà quá trình xử lý tài liệu thông minh (IDP) hiện đại mang lại gần như không thể cưỡng lại được. Và việc áp dụng sẽ còn tăng tốc hơn nữa khi sức mạnh của AI (GenAI) có bước nhảy vọt lớn về khả năng, sự mạnh mẽ và dễ triển khai của IDP. 

UiPath là một trong những nhà cải tiến lớn trong lĩnh vực IDP. Chiến lược sản phẩm và đổi mới IDP của chúng tôi có thể tóm tắt như thế này: tận dụng tự động hóa, AI chuyên dụng và GenAI để vượt qua các rào cản IDP mà trước đây đã ngăn cản việc áp dụng nó. Những rào cản này bao gồm:

  • Những thách thức trong việc xử lý sự biến đổi cao ở các định dạng tài liệu

  • Khó khăn trong việc xử lý dữ liệu phi cấu trúc

  • Đào tạo mô hình vất vả

  • Hạn chế về khả năng mở rộng

  • Mối lo ngại về an ninh

Trong khoảng hơn một năm qua, chúng ta đã đạt được những bước tiến đáng chú ý trong việc giải quyết những vấn đề này. Trên thực tế, Tập đoàn Everest gần đây đã vinh danh UiPath trong năm thứ hai liên tiếp, với tư cách là Đơn vị dẫn đầu trong hạng mục Đánh giá PEAK Matrix® của IDP. Năm nay, UiPath có xếp hạng cao nhất về cả 'tầm nhìn và năng lực' cũng như 'tác động trên thị trường'. ( Bạn có thể đăng ký tại đây để nhận bản sao độc quyền của báo cáo hồ sơ UiPath. )

Biểu đồ Everest IDP 2024

Vì vậy, với bối cảnh đó, chúng ta hãy xem xét các cách chúng tôi kết hợp tự động hóa, AI chuyên dụng và GenAI để đưa IDP lên một tầm cao mới và biến nó thành một đề xuất có giá trị hấp dẫn hơn nữa.

Sử dụng LLM cơ bản để giải quyết các thách thức về dữ liệu phi cấu trúc

Một trong những cách chúng tôi đã vượt qua các ranh giới hiện có trong IDP là thông qua việc sử dụng LLM cơ bản như GPT-4, được đào tạo trên các bộ dữ liệu đa dạng.

Chúng tôi đã kết hợp các khả năng GenAI mới vào các sản phẩm hiện có của mình. Ví dụ: chúng tôi hiện sử dụng LLM trong Hiểu tài liệu UiPath, điều này đã cải thiện đáng kể khả năng xử lý chính xác các tài liệu phi cấu trúc dạng tự do như thỏa thuận pháp lý, hợp đồng và email ở quy mô cao. GenAI cũng cho phép chúng tôi giảm đáng kể nỗ lực đào tạo các mô hình để hiểu các tài liệu và biểu mẫu cụ thể—giảm thời gian tới 80%, từ vài tuần xuống còn vài giờ hoặc một hoặc hai ngày.

Tại HUB International, một công ty bảo hiểm lớn, những khả năng mới được hỗ trợ bởi GenAI này đã biến một nhiệm vụ thủ công không thể thực hiện thành một nhiệm vụ được hoàn thành chỉ trong vài phút:

Chúng tôi cần lấy và xác định dữ liệu từ hàng nghìn tài liệu phi cấu trúc—một nhiệm vụ mà trước đây chúng tôi chưa thể hoàn thành thủ công do tính phức tạp và tính biến đổi cao của tài liệu. Giờ đây, các khả năng AI tổng quát trong Hiểu tài liệu UiPath thực hiện điều đó trong vòng chưa đầy năm phút—với độ chính xác đáng kinh ngạc và tiết kiệm thời gian cho nhóm của chúng tôi.

Thạch Nguyễn, Giám đốc Đổi mới Kỹ thuật số, HUB International

Chuyển sang LLM chuyên dụng để tăng độ chính xác và tăng hiệu quả hoạt động

Mặc dù LLM cơ bản có phạm vi nhiệm vụ rộng mà chúng có thể thực hiện tốt nhưng chúng có những hạn chế và điểm yếu đáng kể khi áp dụng chúng cho các miền, quy trình kinh doanh hoặc loại tài liệu cụ thể. Điều này tạo ra một vấn đề khi cố gắng tận dụng chúng cho IDP (về cơ bản là xử lý các loại tài liệu cụ thể trong một bối cảnh kinh doanh cụ thể, được xác định). 

Hãy nghĩ mà xem: nếu bạn đang tìm kiếm giải pháp IDP, có thể bạn không quan tâm liệu mô hình có biết ai đã chỉ đạo Titanic hay quá trình quang hợp diễn ra như thế nào hay không. Thay vào đó, bạn muốn một mô hình biết trường nào bắt buộc phải điền vào biểu mẫu thuế của công ty (hoặc quốc gia) của bạn hoặc tài liệu nào có thể được chấp nhận làm bằng chứng nhận dạng. Bạn muốn một mô hình có độ chính xác cao hơn nhiều ngay lập tức, yêu cầu thời gian đào tạo ít hơn đáng kể và hiệu quả tính toán cao hơn nhiều. Đây chính xác là những gì LLM chuyên ngành phù hợp có thể cung cấp.

Đó là lý do tại sao chúng tôi đã tạo ra các LLM chuyên biệt được xây dựng dựa trên kho kiến ​​thức dành riêng cho các lĩnh vực, ngành và quy trình kinh doanh. Tại Hội nghị thượng đỉnh AI UiPath gần đây, chúng tôi đã công bố Tính khả dụng chung của hai mô hình như vậy là DocPath và CommPath. Trong khi tận dụng cốt lõi của GenAI, các mô hình này được chuyên biệt hóa và điều chỉnh để xử lý các tài liệu kinh doanh phức tạp và thông tin liên lạc đa dạng—từ các tương tác phức tạp đến các tài liệu và bảng biểu dạng tự do. 

Bằng cách thu hẹp trọng tâm nhưng vẫn giữ được sức mạnh mới to lớn của GenAI, các LLM chuyên dụng của chúng tôi có thể vượt trội hơn đáng kể về độ chính xác đầu ra của các LLM hiện có—điều này rất quan trọng trong việc cung cấp IDP hiệu quả, đáng tin cậy. (Hãy nghĩ mà xem: số 0 bổ sung được trích từ hóa đơn có thể khiến khoản thanh toán tăng gấp 10 lần hoặc gây ra sự chậm trễ trong quy trình thanh toán tài khoản, có khả năng làm căng thẳng mối quan hệ với nhà cung cấp, giảm hiệu quả và thậm chí gây tổn thất tài chính và danh tiếng cho công ty.)

Để kiểm tra tính chính xác của UiPath LLM so với cả LLM cơ bản và các nhà cung cấp IDP khác, chúng tôi đã thực hiện các thử nghiệm trực tiếp trên một bộ tài liệu doanh nghiệp đa dạng. Kết quả? So với các mô hình GenAI hàng đầu, tỷ lệ lỗi DocPath thấp hơn từ 45% đến 76%. Hơn nữa, trong việc diễn giải các cấu trúc bảng phức tạp, UiPath DocPath vượt trội hơn các nhà cung cấp IDP và GenAI khác bằng cách ghi nhận lỗi trích xuất ít hơn 30-65%.

Ít lỗi trích xuất hơn với biểu đồ UiPath DocPath

Nguồn: Thử nghiệm của UiPath AI R&D trên nhiều bộ tài liệu doanh nghiệp

LLM chuyên dụng cũng tỏ ra có lợi trong việc giảm thiểu hoặc thậm chí loại bỏ nhu cầu đào tạo tùy chỉnh, vì chúng được điều chỉnh tốt hơn để xử lý nhiều loại tài liệu và thông tin liên lạc ngay lập tức. Ví dụ: mô hình hỗ trợ ứng dụng độc lập sao chép và dán tự động miễn phí của chúng tôi, UiPath Clipboard AI  , mang lại độ chính xác hơn 90% ngay từ đầu cho nhiều loại tài liệu được sử dụng thường xuyên như hóa đơn, hóa đơn tiện ích, đơn đặt hàng, biên lai, hộ chiếu và mẫu W2.

 
 

LLM sáng tạo chuyên biệt cho một số nhiệm vụ nhất định cho phép tự động hóa doanh nghiệp trên quy mô lớn. Đối với IDP, LLM chuyên dụng mang lại tỷ lệ lỗi thấp hơn, hiệu suất được cải thiện và thời gian đánh giá nhanh hơn, chuyển đổi hiệu quả các tài liệu và thông tin liên lạc phi cấu trúc và bán cấu trúc thành dữ liệu số hóa có giá trị có thể được sử dụng trong các quy trình tự động—tăng hiệu quả hoạt động của tổ chức.

Đảm bảo tính nhất quán và bảo mật cho việc triển khai GenAI

Mặc dù việc sử dụng GenAI cải thiện đáng kể hiệu suất của IDP và mở rộng khả năng của nó, nhưng nó cũng gây ra rủi ro vận hành và bảo mật ngày càng tăng. Ví dụ: LLM cơ bản yêu cầu quyền truy cập rộng rãi vào dữ liệu để hoạt động hiệu quả, do đó thông tin kinh doanh nhạy cảm có thể vô tình bị lộ hoặc xử lý sai. Hơn nữa, LLM cơ bản có thể thiếu tính nhất quán có thể dự đoán được, nghĩa là chúng phản ứng khác nhau với cùng một câu hỏi vào những thời điểm khác nhau. Liên quan, chúng có thể tạo ra cái gọi là ảo giác làm đầu ra - nghĩa là mô hình đưa ra câu trả lời không chính xác, không dựa trên bất kỳ sự kiện hoặc logic nào nhưng vẫn coi nó là chính xác.

Để đảm bảo toàn bộ sức mạnh của GenAI có thể được phát huy một cách an toàn trong toàn doanh nghiệp, những rủi ro này có thể và phải được giảm thiểu. Chúng tôi đã thực hiện một số hành động để làm như vậy.

Để giải quyết các vấn đề bảo mật dữ liệu, UiPath cung cấp một lớp bảo mật bổ sung cho các mô hình tổng hợp —Lớp tin cậy AI của UiPath—giúp đảm bảo tuân thủ các tiêu chuẩn tuân thủ. Ngoài ra, để giảm thiểu rủi ro xảy ra lỗi, có một số cách để xác thực kết quả đầu ra của mô hình và duy trì sự tham gia của con người trong vòng lặp để kiểm tra kỹ kết quả, nếu cần.  

Đọc thêm về Lớp tin cậy AI của UiPath.

Hơn nữa, bản thân việc sử dụng LLM chuyên dụng thay vì LLM cơ bản đã là một biện pháp giảm thiểu rủi ro đáng kể. Ví dụ: DocPath và CommPath xử lý dữ liệu một cách an toàn trong môi trường bảo mật của hệ sinh thái đám mây UiPath. Điều này không chỉ giúp đảm bảo tuân thủ toàn diện các tiêu chuẩn tuân thủ mà còn duy trì quyền riêng tư dữ liệu, giảm đáng kể nguy cơ vi phạm bảo mật. Hơn nữa, DocPath và CommPath ít có khả năng gây ảo giác hơn vì câu trả lời của họ chỉ dựa trên dữ liệu và bối cảnh từ các tài liệu và tin nhắn của công ty mà họ xử lý.

LLM đi đầu trong quá trình phát triển kỹ thuật số trong IDP 

Sự xuất hiện của GenAI trong IDP đã tạo điều kiện cho sự tiến bộ to lớn trong hoạt động kinh doanh, tuy nhiên những tiến bộ này cũng đi kèm với những thách thức riêng. LLM chuyên biệt đóng một vai trò quan trọng trong việc vượt qua những rào cản này đồng thời nâng cao hiệu quả hoạt động. Với khả năng xử lý thông minh lượng lớn dữ liệu phi cấu trúc, LLM đang dẫn đầu một làn sóng mới về năng suất và tăng trưởng trong thế giới kinh doanh. Khi thế giới tiếp tục phát triển về mặt kỹ thuật số, vai trò then chốt của họ trong việc quản lý dữ liệu liền mạch sẽ ngày càng trở nên rõ ràng hơn.

UiPath đã nắm bắt các khả năng mới xuất hiện từ GenAI và LLM, sử dụng rộng rãi những tiến bộ này trong nỗ lực cung cấp IDP và tự động hóa doanh nghiệp tốt nhất trong các quy trình kinh doanh khác nhau. Bạn có thể xem Hội nghị thượng đỉnh AI của UiPath để tìm hiểu về các chức năng mới nhất của UiPath AI như DocPath và CommPath LLM.