Giải pháp AI Việt giúp nhận diện bảng biểu dưới hai giây
Tại hội nghị chuyên về trí tuệ nhân tạo ECAI 2024 cuối tuần qua ở Tây Ban Nha, Viettel AI trình diễn giải pháp nhận diện, trích xuất thông tin từ bảng biểu "có tốc độ nhanh gấp bốn lần" so với những giải pháp hiện có, cho phép xuất cấu trúc và dữ liệu bảng biểu từ ảnh trong thời gian thực.
Việc dùng công nghệ để tự động nhận diện và trích xuất văn bản từ hình ảnh vốn không mới, nhờ các công nghệ như OCR và AI. Tuy nhiên trong nhiều năm, thách thức của các giải pháp là chưa thể xử lý nhanh hình ảnh chứa bảng biểu, do sự đa dạng trong cấu trúc bảng, như có bảng không chứa viền, có nhiều ô trống, các ô kích thước khác nhau.
"Trong khi chữ viết đã được xử lý khá hiệu quả, việc trích xuất chính xác thông tin từ bảng biểu trong tài liệu đến nay vẫn là bài toán khó", đại diện Viettel AI đánh giá. "Tự động hóa quá trình này giúp giảm bớt công việc nhập liệu thủ công, tăng độ chính xác và tốc độ xử lý văn bản".
Nhóm cho biết đã nghiên cứu để giảm quá trình xử lý xuống một giai đoạn thay vì nhiều giai đoạn như cách truyền thống, từ đó giúp xử lý loại bảng nhiều hàng, cột nhanh hơn. Ngoài ra, giải pháp cũng làm giảm độ phức tạp của quy trình xử lý, giúp tiết kiệm bộ nhớ và quy trình huấn luyện mô hình AI. Theo công bố tại ECAI, giải pháp của các kỹ sư Việt Nam cho khả năng trích xuất đạt 40 khung hình/giây trong một số trường hợp, dữ liệu nhận về có độ khác biệt khoảng 2% so với dữ liệu chuẩn.
Theo các chuyên gia, tính hiệu quả của công nghệ sẽ cần được đánh giá thêm trong quá trình sử dụng thực tế. Trong thử nghiệm với hình ảnh chứa hai bảng biểu, giải pháp có thể xuất dữ liệu cùng cấu trúc bảng lập tức, với cấu trúc bảng và số liệu chuẩn. Tuy nhiên, vẫn còn một số điểm cần cải thiện, như dấu ">=" trong cách viết thông thường chưa được tái hiện chính xác.
Đại diện nhóm nghiên cứu cho biết công nghệ cũng đã được tích hợp vào giải pháp xử lý hồ sơ thông minh Viettel IDP, cho khả năng tự động bóc tách thông tin dạng ảnh với tốc độ dưới 2 giây mỗi trang tài liệu, nhanh hơn 60-80 lần so với nhập liệu thủ công, độ chính xác 90%, giúp người dùng tiết kiệm 80% thời gian phê duyệt hồ sơ.
"Công nghệ được công bố tại Hội nghị ECAI 2024 là bước đầu trong quá trình tăng tốc độ xử lý của giải pháp, hướng đến mục tiêu xử lý thông tin không chỉ dưới hai giây mà là tức thì", đại diện nhóm cho biết.
Theo vnexpress.net
Tin cùng chuyên mục
- Nokia chuẩn bị triển khai 5G tại Việt Nam 24.09.2024 | 13:58 PM
- Sinh động các chương trình trực tiếp tại Fanpage Báo Tuyên Quang online 03.01.2023 | 08:16 AM
- Thực hiện quy định về chuẩn hóa thông tin thuê bao di động 31.03.2023 | 16:13 PM
- Hưởng ứng ngày Chuyển đổi số quốc gia 10/10Chuyển đổi số vì một cuộc sống tốt đẹp hơn 09.10.2022 | 21:42 PM
- Sở Thông tin và Truyền thông: Diễn tập ứng phó sự cố an toàn thông tin mạng năm 2022 04.10.2022 | 17:30 PM
- Hướng dẫn trẻ em sử dụng mạng internet an toàn và hiệu quả 05.08.2022 | 08:27 AM
- Người dùng nên cập nhật Chrome 92 ngay để vá 9 lỗ hổng nghiêm trọng 21.08.2021 | 15:47 PM
- UBND tỉnh nghe báo cáo dự thảo đề án chuyển đổi số tỉnh Thái Bình giai đoạn 2021 - 2025, định hướng đến năm 2030 21.07.2021 | 19:16 PM
- Thiết bị đầu tiên chuyển suy nghĩ thành câu nói 19.07.2021 | 09:47 AM
- Tại sao không gộp các ứng dụng chống dịch thành một 'super app' 19.07.2021 | 09:48 AM
Xem tin theo ngày
- UBND tỉnh: Nghe và cho ý kiến về một số nội dung quan trọng
- Tiếp tục chương trình kỳ họp thứ tám: Quốc hội thảo luận về các dự án luật, nghị quyết
- Hội nghị Ban Thường vụ Tỉnh ủy
- Quốc hội tiếp tục thảo luận về các dự án luật
- Chống lãng phí - Thông điệp mạnh mẽ của Tổng Bí thư Tô Lâm
- Hội nghị Ban Chỉ đạo thực hiện các dự án trọng điểm của tỉnh
- Quốc hội thảo luận về các dự án luật
- Họp thống nhất nội dung đề xuất phê duyệt Báo cáo nghiên cứu khả thi dự án tuyến đường bộ cao tốc CT.08
- Quốc hội thảo luận về việc thực hiện chính sách, pháp luật về quản lý thị trường bất động sản và phát triển nhà ở xã hội
- UBND tỉnh làm việc với các nhà đầu tư Hàn Quốc