Tổng đài chăm sóc khách hàng tương tác trung bình hàng chục nghìn cuộc gọi với khách hàng mỗi ngày, nhưng trong nhiều năm, phần lớn dữ liệu này gần như chưa được khai thác hiệu quả để phát hiện sớm vấn đề vận hành. Đây là giới hạn phổ biến của mô hình kiểm soát tổng đài truyền thống, khi doanh nghiệp chỉ có thể nghe lại một tỷ lệ rất nhỏ cuộc gọi để đánh giá chất lượng dịch vụ.

AI THAM GIA TRỰC TIẾP VÀO VẬN HÀNH TỔNG ĐÀI
Tổng đài chăm sóc khách hàng của nhà mạng VinaPhone hiện triển khai hệ thống phân tích cuộc gọi ứng dụng trí tuệ nhân tạo - VNPT iSense để giám sát và phân tích chất lượng dịch vụ trên 100% cuộc gọi, phục vụ hoạt động chăm sóc khách hàng ở quy mô hơn 30 triệu thuê bao.
Theo ông Vũ Xuân Nhân - Trưởng phòng Công nghệ, Trung tâm Dịch vụ khách hàng VinaPhone, iSense tham gia trực tiếp vào quá trình vận hành tổng đài thông qua các lớp xử lý như chuyển giọng nói thành văn bản, phân tích nội dung hội thoại, nhận diện cảm xúc người nói và theo dõi mức độ tuân thủ nghiệp vụ của điện thoại viên trong từng cuộc gọi.
Trên nền tảng đó, công nghệ Generative AI (AI tạo sinh) được iSense ứng dụng để hiểu ngữ cảnh, tự động tóm tắt hội thoại, phân loại chủ đề trao đổi và tổng hợp các vấn đề có tính lặp lại từ dữ liệu cuộc gọi quy mô lớn.
Theo đó, thay vì chỉ dừng ở việc ghi nhận thông tin, iSense giúp bộ phận vận hành nhận diện sớm các dấu hiệu bất thường trong dịch vụ, các điểm nghẽn trong quy trình chăm sóc khách hàng hoặc những vấn đề có nguy cơ phát sinh khiếu nại. Giải pháp đồng thời hỗ trợ gợi ý thông tin và tri thức theo ngữ cảnh hội thoại, giúp tổng đài viên rút ngắn thời gian tra cứu và xử lý tình huống ngay trong quá trình tương tác với khách hàng.
Để Generative AI có thể hiểu đúng ngữ cảnh hội thoại, dữ liệu đầu vào cần đạt độ chính xác rất cao ở khâu nhận diện giọng nói. Phương pháp tiếp cận mới về công nghệ này vừa được VNPT AI - đội ngũ phát triển của iSense - trình bày tại ICASSP 2026, hội nghị quốc tế top 1 về xử lý tín hiệu và giọng nói của IEEE (Barcelona, Tây Ban Nha) vào 6/5 vừa qua.
Trong phiên làm việc cùng các tổ chức và trường đại học gồm Massachusetts Institute of Technology (MIT), Tsinghua University (đại học Thanh Hoa) và Ant Group (Alibaba)... tại hội nghị, VNPT AI đã chia sẻ và phân tích hiệu quả của hướng tiếp cận mới, một mặt cải thiện hiệu suất, mặt khác tăng độ chính xác so với các phương pháp cũ. Phương pháp này nhận được rất nhiều quan tâm của cộng đồng khoa học quốc tế.
Ông Nhân cũng nhấn mạnh thay đổi lớn nhất sau khi triển khai AI không phải việc thay thế con người, mà ở khả năng mở rộng phạm vi giám sát chất lượng ở quy mô lớn. “Với tổng đài quy mô lớn, gần như không thể nghe và đánh giá toàn bộ cuộc gọi bằng phương pháp thủ công. AI giúp xử lý khối lượng lớn các tác vụ lặp lại để đội ngũ kiểm soát chất lượng có thể tập trung hơn vào các trường hợp cần đánh giá nghiệp vụ”, ông cho biết.
Trong năm 2025, iSense giám sát và phân tích hơn 30 triệu cuộc gọi. Hệ thống góp phần giảm khoảng 70% khối lượng giám sát thủ công của kiểm soát viên, đồng thời giảm khoảng 21% chi phí nhân sự thuê ngoài liên quan đến hoạt động kiểm soát chất lượng tổng đài.
Theo đại diện VinaPhone, khi phần lớn thời gian không còn dành cho việc nghe lại cuộc gọi thủ công, bộ phận kiểm soát chất lượng có điều kiện tập trung nhiều hơn vào các vấn đề vận hành thực tế như xử lý tình huống bất thường, cải thiện quy trình chăm sóc khách hàng hoặc đào tạo điện thoại viên.
AI CÓ CHỦ QUYỀN GIẢI BÀI TOÁN TỔNG ĐÀI TIẾNG VIỆT
Để AI có thể vận hành hiệu quả trong môi trường tổng đài tiếng Việt, yếu tố quan trọng nằm ở khả năng làm chủ dữ liệu, mô hình và quá trình tối ưu công nghệ cho thực tế vận hành tại Việt Nam.
Một trong những thách thức lớn nhất khi triển khai AI cho tổng đài tại Việt Nam là đặc thù của tiếng Việt trong môi trường hội thoại thực tế. Khách hàng có thể nói nhanh, nói ngắt quãng, chen ngang, sử dụng từ địa phương hoặc thay đổi ngữ điệu liên tục theo vùng miền và cảm xúc.
Để giải quyết bài toán này, iSense được xây dựng theo hướng kết hợp nhiều lớp công nghệ AI trong toàn bộ vòng đời hội thoại. Hệ thống tích hợp các công nghệ như speech recognition để chuyển giọng nói thành văn bản, speaker diarization để phân tách người nói, emotion detection để nhận diện cảm xúc qua đặc trưng âm thanh và Generative AI để thực hiện các tác vụ phức tạp hơn.
Mục tiêu của hệ thống không chỉ dừng ở việc xác định khách hàng nói gì, mà còn hỗ trợ doanh nghiệp nhận diện vấn đề nằm ở đâu, điện thoại viên xử lý như thế nào và cần hành động gì tiếp theo.
Nhóm phát triển iSense cho biết các mô hình AI trong iSense được tối ưu trên môi trường tổng đài thực tế trong nhiều năm vận hành, phân tích dữ liệu với đa dạng vùng miền, ngữ điệu và tình huống nghiệp vụ khác nhau. Điều này giúp hệ thống tối ưu mạnh hơn cho tiếng Việt và các đặc thù giao tiếp thực tế của khách hàng trong nước.
Ở góc độ giải pháp, iSense cũng được thiết kế để có thể tùy biến linh hoạt theo từng nghiệp vụ, từng nhóm khách hàng và tiêu chí phân tích riêng của doanh nghiệp thay vì áp dụng một bộ tiêu chuẩn cố định cho mọi tổng đài.
Theo nhóm phát triển, đây là hướng lợi thế của các nền tảng AI có chủ quyền, khi doanh nghiệp có thể chủ động làm chủ dữ liệu, công nghệ và khả năng tùy biến hệ thống theo yêu cầu vận hành thực tế.
![[BIZTEK] - Chuyên trang Siêu thị số của Tạp chí điện tử Nhịp sống số](https://s-aicmscdn.biztek.vn/btek-media/logo/biztek.vn.png?v=1.1)