Friday, July 28, 2017

Tình hình AI tại thị trường Việt Nam – Đầy khó khăn và thách thức

Nhắc tới “artificial intelligence”, “machine learning”, hay “neural nets” với bất kì nhóm software engineers nào mà bạn gặp, tôi bảo đảm bạn sẽ nghe một đống chuyện từ họ. Trong thời đại này, tất cả các ông lớn về công nghệ đều sẵn sàng chi mạnh tay để có tích hợp những công nghệ đấy vào sản phẩm của họ. Ngay cả các software engineer mới cũng cố gắng tham gia vào mỏ vàng trên.
Artificial intelligence thực chất chính là cách ta tái tạo và mô phỏng theo trí não của con người. Mục tiêu là để cho ra đời những bộ máy có khả năng thực hiện được những công việc chỉ có con người mới làm được như là biểu đạt cảm xúc, đó không phải là một việc dễ dàng. Chính vì thế mà hôm nay, Vietcetera phỏng vấn anh Herve Vu Roussel, head of data engineering tại AI firm Sentifi– một trong những người đi đầu về AI tại Việt Nam. Cùng lắng nghe những chia sẻ, quan điểm của anh về cộng đồng và khả năng phát triển cho AI tại thị trường Việt Nam.

Tình hình phát triển AI tại Việt Nam hiện nay như thế nào?

Đây là một câu hỏi khó, bởi không như San Francisco hay Montreal, Việt Nam vẫn chưa thật sự được phát triển hết tiềm năng của nó. Chúng ta vẫn còn đang trên tiến trình phát triển. Nói đến một số cá nhân/ tổ chức nổi bật thì tôi nghĩ tới Tinypulse và Trusting Social. Tinypulse nhắm tới cải thiện tinh thần cho nhân viên và khiến họ gắn bó với công ty thông qua các khảo sát, phân tích cảm xúc, natural language processing. Trusting Social, theo tôi, là một ngôi sao đang lên. Là đối tác với Viettel, công ty vừa kêu gọi vốn thành công lên đến vài triệu đô. Ý tưởng đằng sau Trusting Social là liên quan đến việc tính toán và phỏng đoán các con số. Khá là thú vị bởi khả năng ứng dụng cho nhiều lĩnh vực khác nhau của nó.

Tôi nghĩ thì hiện tại Sentifi vẫn đang đứng đầu những công ty mạnh về AI tại Việt Nam. Chúng tôi là công ty đi tiên phong về sử dụng mảng trí tuệ nhân tạo trong non-trivial applications. Nhóm data engineering của chúng tôi sử dụng machine learning, deep learning, và AI để phân tích hơn một tỉ tweets mỗi tháng để thu được insight từ cộng đồng. Sau đó dựa vào những data đó chung tôi liên hệ với những phân tích từ thị trường tài chính. Đó là cách giải thích đơn giản nhất mà tôi có thể đưa ra. Điều làm khác biệt Sentifi với các đối thủ khác nằm ở việc các sản phẩm của hãng đều tích hợp những công nghệ đi đầu thị trường Việt Nam.
Tôi tin rằng trong tương lai không xa, AI sẽ giúp cải thiện chất lượng dịch vụ tại Việt Nam. Ví dụ như giờ bạn đã có thể khám bệnh online, có một AI chuyên theo dõi sức khỏe và chăm sóc nhắc nhở bạn hay việc gửi hình X-quang để cho phỏng đoán bệnh tình mà không hề thua kém một bác sĩ thực thụ.

Có cộng đồng AI nào lớn tại Việt Nam?

Thật không may là hiện tại vẫn chưa có. Chỉ vài nhóm nhỏ lẻ trên Facebook với tính tương tác thấp. Tháng 3 vừa rồi, IBM AI XPRIZE có tổ chức sự kiện AI đầu tiên tại Việt Nam. Với hơn trăm người tham dự. Bạn có thể nói mọi người đều rất tò mò và muốn tìm hiểu về AI nhưng phần lớn đều chưa có kinh nghiệm hay đủ trình độ để hiểu sâu về nó. Vì vậy mà chúng tôi cũng đang cố gắng thúc đẩy AI tại Việt Nam nhưng cần thêm thời gian.
Từng làm việc vài lần với AI XPRIZE cũng như hướng dẫn nhiều teams tại Việt Nam, XPRIZE là một tổ chức phi lợi nhuận chuyên khuyến khích tranh tài nhằm cải thiện kiến thức chung của thế giới. Tổ chức này cũng lên một kế hoạch phát triển AI trong vòng 4 năm nhằm giải quyết các vấn đề nan giải của nhân loại. Phần thưởng cho team thắng cuộc là 5 triệu đô và cơ hội được diễn thuyết tại TED 2020. Ngoài ra nhiều công ty và nguồn lực sẽ hộ trợ cho các nhóm tham gia XPRIZE. Tôi muốn gửi thông điệp rằng Việt Nam có tiềm năng rất lớn trong AI.
-------------------- Thông tin cho Dev --------------------

Nói về công việc của tôi với XPRIZE, tôi chủ yếu nắm vai trò hướng dẫn và giúp các team Việt Nam. Hiện các nhóm đều có cho mình những project khá thú vị. Như Altoera với ý tưởng kết hợp computer vision, hardware, và software nhằm tạo ra tính năng image recognition để phát hiện sâu bệnh của cây trồng. Hiện mọi thứ chỉ ở software nhưng trong tương lai thì chúng tôi sẽ phát triển cả robot để chúng theo dõi và diệt trừ sâu bệnh luôn. Một project khác cũng rất có triển vọng là Dropdeck, với ý tưởng kết nối các nhà đầu tư với  startup entrepreneurs và giúp bảo đảm các startup có thể tìm kiếm nguồn vốn đầu tư dễ dàng hơn.

Lời khuyên của anh đối với những bạn muốn tham gia vào lĩnh vực này?

Hãy tìm kiếm thông tin tuyển dụng của các công ty AI và vào làm cho họ. Ngoài ra hãy có những project của riêng mình cũng như tham gia một số cuộc thi trên Kaggle. Ngoài ra còn rất nhiều nguồn online với hình thức tượng tự như Coursera, gồm các khóa học từ các đại học danh tiếng trên thế giới. Không có lí gì mà bạn không thể tự học trong hời đại internet này.

Điều gì đang cản trở sự phát triển của AI tại Việt Nam?

Một trong những vấn đề lớn nhất là đầu vào quá khó. Mất 1 đến 2 năm chỉ để nghiên cứu tìm hiểu là chuyện bình thường, rồi việc thiếu hụt về sức người – không có đủ người giỏi hiểu biết về machine learning cũng như data scientists. Hơn nữa, AI còn khá mới lạ, ngay cả trên thế giới thì số lượng công ty chuyên về trí thông minh nhân tạo cũng còn khá ít, như vậy sẽ khiến chi phí cho phát triển tăng rất nhiều.
Một vấn đề nan giải khác tại Việt Nam là việc có quá ít dữ liệu và thông tin. Mà khi nói về AI thì data luôn giữ vai trò quan trọng hàng đầu. Việt Nam rất hạn chế về khoảng này. Nói chi đâu xa, khi bạn xài Google Maps, thỉnh thoảng sẽ có những đường không hề có trên map. AI thực chất chính là việc chúng ta thu thập và sử dụng data để tạo ra nó. Như vậy nếu không có dữ liệu thì AI coi như chết.

Cái nữa là việc phát triển AI vẫn chưa được ủng hộ và khuyến khích tại Việt Nam. Bởi vì do giá lao động còn thấp nên việc áp dụng AI thật sự không hiệu quả. Đơn cử như việc dùng robot bảo vệ. Chỉ tính riêng chi phí phát triển và bảo trì robot đã mắc gấp mấy chục lần việc thuê bảo vệ. Vậy AI chỉ thực sự có đất dụng võ khi người Việt mình được cải thiện về đời sống về có mức lương cao.
Tuy vậy, giờ chúng ta đã bắt đầu nghiêm túc hơn về vấn đề trí thông minh nhân tạo. Bạn có thể thấy Google đang dần trở thành một công ty về AI. Điều Việt Nam có thể làm là đẩy mạnh nhiều chương trình cho data engineering, data mining, và databases. Nhưng quan trọng nhất là tạo ra một cộng đồng và nuôi dưỡng nó. Thật may là công nghệ phát triển rất nhanh. Hồi 10 năm trước, để kiếm được việc liên quan tới AI có thể gọi là không thể bởi nó như chỉ dành cho phim ảnh viễn tưởng thôi. Nhưng giờ thì các start-up AI bắt đầu xuất hiện trên toàn thế giới.

Anh có muốn gửi lời chia sẻ gì đến các bạn đọc không?

Bởi việc AI trở nên khá hot nên nhiều startup cứ áp dụng nó một cách vô tội vạ vào mọi thứ họ có thể. Tôi mong các bạn start-up nên nhớ quan trọng nhất vẫn là sản phẩm của mình có khả năng giải quyết vấn đề thật cho khách hàng thật vẫn là điều quan trọng nhất, AI chỉ là một phương tiện giúp ta đạt được điều đó.

Techtalk via Vietcetera

Trí tuệ nhân tạo có thực sự ghê gớm?

Bài viết của Andrew Ng - Giám đốc khoa học của Baidu, đồng sáng lập Coursera.
Andrew ng
Rất nhiều lãnh đạo có hỏi tôi về khả năng thực sự của trí tuệ nhân tạo. Họ muốn có cái nhìn khách quan nhất về ảnh hưởng của AI tới hoạt động của doanh nghiệp mà họ đang nắm giữ.
Qua sách, báo, blog, truyền hình,... Các bạn đều thấy AI đang thể hiện vai trò tuyệt đối của mình trong các bài toán rất phức tạp và đa dạng trong các lĩnh vực như: tìm kiếm, quảng cáo, thương mại điện tử, tài chính,... Tuy nhiên, giới truyền thông đang tung hô và thần thánh hóa AI một cách ngoạn mục.
Tôi - Andrew Ng, cựu team lead của Google Brain, nguyên giám đốc phòng thí nghiệm AI của đại học Stanford. Tôi đã phát triển rồi dẫn dắt những team làm AI hàng đầu thế giới và cho ra các sản phẩm AI được hàng triệu người sử dụng. Tôi đã chứng kiến sức mạnh của AI. Tuy nhiên tôi khẳng định, AI không phải là điều gì đó quá kì diệu như truyền thông đang nhắc đến.
Google Brain
Bạn sẽ bất ngờ đấy. Khác với việc được tung hô như một vị thần, trên thực tế, các quá trình triển khai AI đều hướng đến mục đích chung: đưa dữ liệu đầu vào (input) A. AI sẽ sử dụng đầu vào đó để generate dữ liệu đầu ra (output) B với tốc độ nhanh nhất có thể.
Input A Output B Ứng dụng
Ảnh Nhận dạng xem có phải là mặt người không Tự động tag ảnh
Giấy vay tiền Xác nhận xem tiền vay đã được trả chưa? Đánh giá & phê duyệt các khoản vay
Quảng cảo + thông tin người dùng Người dùng có click quảng cáo hay không Chạy banner quảng cáo
Một đoạn âm thanh Transcript (lời thoại dạng text) Nhận diện giọng nói
Một câu (tiếng Anh) Câu tương đương trong ngôn ngữ khác Dịch thuật
Dữ liệu của các cảm biến (trong máy móc..) Đánh giá rủi ro Hệ thống an toàn
Camera + các cảm biến trên xe Vị trí và trạng thái của xe Ô tô tự lái
Tham khảo các khóa học lập trình online, onlab, và thực tập lập trình tại TechMaster
Việc xây dựng được các hệ thống nhận input A và cho ra output B (gọi tắt là A -> B) sẽ làm thay đổi bộ mặt của nhiều ngành. Trong giới kỹ thuật, phương pháp xây dựng các hệ thống nhận input A và cho ra output B như trên được gọi là supervised learning (tạm dịch:học máy có giám sát).
Trí tuệ của con người thừa sức xử lý được các bài toán dạng A -> B như trên, tuy nhiên máy móc thì cần một quá trình phát triển dài hơi trước khi chạm đến đẳng cấp đó. Bạn thấy đấy, chiếc máy tính đầu tiên ra đời cách đây gần 1 thế kỷ. Trong khi đó, các hệ thống AI tối tân nhất hiện nay mới chỉ giải quyết một số bài toán cụ thể như tôi đã liệt kê ở trên.Tuy nhiên các hệ thống đó không ngừng được đầu tư và cải tiến. Đại diện sáng giá nhất của AI hiện nay sử dụng deep learning (deep learning được phát triển theo hướng mô phỏng một phần cơ chế hoạt động của não người). AI được nhiều nhóm nghiên cứu tiếp cận theo các phương pháp khác nhau. Một số nhóm đã chứng minh, bằng cả lý thuyết lẫn thực tế, rằng AI rất mạnh trong việc giải quyết các bài toán trong một ngữ cảnh cụ thể. Tuy vậy, AI cần vượt qua một "bậc thang" nữa để có được những kết quả mang tính cách mạng trên nhiều lĩnh vực. Và con đường dẫn đến "bậc thang" này vẫn chưa được tìm ra.
deep learning
Khi đã nắm được AI có thể và không thể làm những việc gì, tiếp theo ta cần kết hợp nó với chiến lược phát triển. Điều này đồng nghĩa với việc bạn phải biết được thông tin mình thu thập nằm ở đâu, thu thập như thế nào và khi thu thập thông tin  thì gặp những khó khăn gì.
Nếu để ý kỹ bạn sẽ thấy một nhược điểm của tất cả các hệ thống học máy có giám sát hiện nay: chúng cần quá nhiều input để đưa ra output.
Ví dụ, để hệ thống tự động tag đúng ảnh của một người bạn của bạn, AI cần 10.000 đến 100.000 bức ảnh và một vài thẻ tag có sẵn từ trước để nhận diện bạn của bạn.
Một hệ thống nhận diện và xử lý giọng nói cần 10.000 giờ clip audio chứa đoạn transcipt dài không quá 1000 ký tự để nhận diện đoạn transcript đó khi được đọc và in nó ra màn hình.
Để AI hoạt động hoàn hảo, việc lựa chọn input A và output B phù hợp là cực kỳ quan trọng. Nghe thì có vẻ đơn giản nhưng việc lực chọn A và B một cách tối ưu đã tạo ra nhiều cuộc cách mạng trong một số ngành công nghiệp.
Cộng đồng nghiên cứu và phát triển AI tương đối "mở" - tức các framework, source code được chia sẻ không giới hạn. Tuy nhiên có 2 khó khăn mà bất kỳ cá nhân và tổ chức nào cũng gặp phải khi áp dụng AI cho bài toán của họ:
  1. Về dữ liệu: như tôi đã đề cập ở trên, chọn input và output hợp lý là một việc quan trọng. Các ý tưởng và giải pháp triển khai của các team nghiên cứu AI có thể giống nhau nhưng việc thu thập dữ liệu đúng mẫu thì không phải team nào cũng hoàn thành tốt được. Và tất nhiên thiếu dữ liệu thì các engine AI khó có thể hoàn thành nhiệm vụ được giao.
  2. Về khả năng linh hoạt của team: các engine AI không phải là mỳ ăn liền. Bạn cần tùy biến một chút để nó phù hợp với nhu cầu và bài toán mà bạn đang cần giải quyết. Và tất nhiên rồi, không phải ai cũng có thể tùy biến các engine này.
Bạn sẽ thấy rằng tự tìm hiểu về AI thú vị hơn rất nhiều so với việc chỉ nghe truyền thông tung hô nó. Tuy giúp chúng ta rất nhiều nhưng AI cũng lấy đi của chúng ta không ít. Việc hiểu được vai trò của AI trong bài toán mà chúng ta đang giải quyết sẽ mở ra một chân trời mới cho ngành tự động hóa nói riêng và cách mang công nghiệp nói chung.
 hbr