Nền tảng ‘Vantage’ mới của Google sử dụng hình đại diện AI để kiểm tra tư duy phản biện, hợp tác và kỹ năng thực tế

Tóm tắt ngắn gọn

Google giới thiệu hệ thống AI Vantage để phát triển và đánh giá các kỹ năng con người trong tương lai bao gồm tư duy phản biện, hợp tác, sáng tạo, giải quyết xung đột và quản lý dự án khi AI tiến bộ.

Google’s New ‘Vantage’ Platform Uses AI Avatars To Test Critical Thinking, Collaboration, And Real-World SkillsCông ty công nghệ Google đã giới thiệu một hệ thống AI nhằm phát triển các kỹ năng con người trong tương lai. Khi AI tiếp tục tiến bộ, các kỹ năng mềm bền vững, khó tự động hóa, ngày càng trở nên có giá trị. Những kỹ năng này bao gồm tư duy phản biện, hợp tác, sáng tạo, giải quyết xung đột, quản lý dự án và các khả năng giao tiếp khác.

Được trình bày như “Vantage,” một hệ thống thử nghiệm dựa trên AI nhằm hỗ trợ phát triển và đánh giá các năng lực này thông qua các môi trường tương tác mô phỏng, sáng kiến này đã được phát triển hợp tác với các chuyên gia sư phạm và nhà nghiên cứu, bao gồm các cộng tác viên từ Đại học New York. Nó nhằm hoạt động như một sandbox có cấu trúc để học sinh thực hành và được đánh giá về các kỹ năng sẵn sàng cho tương lai bằng các phương pháp tương tự như trong các môn học cốt lõi như toán học hoặc khoa học. Hệ thống hiện có sẵn bằng tiếng Anh qua Google Labs.

Quy trình hoạt động bằng cách đặt người dùng vào các môi trường đa tác nhân mô phỏng, nơi họ tương tác với các nhân vật ảo do AI tạo ra trong các tình huống mở như tranh luận, giải quyết vấn đề hợp tác hoặc lập kế hoạch dự án. Trong môi trường này, một “Executive LLM” điều phối sử dụng các khung đánh giá đã định sẵn để hướng dẫn tương tác và điều chỉnh điều kiện hội thoại một cách linh hoạt. Điều này bao gồm việc đưa ra bất đồng, thách thức giả định hoặc hướng dẫn hướng đi của cuộc đối thoại nhằm tạo ra bằng chứng hành vi quan sát được liên quan đến các kỹ năng mục tiêu.

Khung AI dựa trên mô phỏng để đánh giá các kỹ năng sẵn sàng cho tương lai

Trong khi đó, một mô hình đánh giá AI riêng biệt phân tích toàn bộ tương tác sau khi hoàn thành nhiệm vụ. Sử dụng cùng các tiêu chí đánh giá có cấu trúc, nó đánh giá bản ghi hội thoại và tạo ra hồ sơ hiệu suất chi tiết, ánh xạ các hành vi quan sát được vào các danh mục kỹ năng cụ thể. Kết quả bao gồm điểm số định lượng và phản hồi định tính, chuyển đổi các tương tác liên cá nhân phức tạp thành các chỉ số có cấu trúc và có thể đo lường về hiệu suất kỹ năng.

Để đảm bảo độ tin cậy phương pháp, hệ thống đã được thử nghiệm hợp tác với Đại học New York qua các nghiên cứu kiểm soát gồm 188 người tham gia từ 18 đến 25 tuổi. Các đánh giá này tập trung vào các năng lực liên quan đến hợp tác như giải quyết xung đột và điều phối dự án. Kết quả cho thấy việc điều hướng hội thoại dựa trên AI thích ứng tạo ra mật độ bằng chứng kỹ năng có thể đánh giá cao hơn so với các mô hình tương tác không hướng dẫn, đồng thời duy trì luồng hội thoại mạch lạc và tự nhiên qua nhiều nhiệm vụ.

Các thử nghiệm tiếp theo so sánh điểm số do AI tạo ra với đánh giá của các chuyên gia con người sử dụng cùng các tiêu chí sư phạm. Kết quả cho thấy mức độ đồng thuận giữa AI và các người đánh giá con người tương đương với mức độ đồng thuận giữa các con người với nhau. Điều này gợi ý rằng các hệ thống tự động có thể xấp xỉ độ nhất quán của các chuyên gia trong các bối cảnh đánh giá có cấu trúc.

Thẩm định bổ sung với các đối tác bên ngoài, bao gồm OpenMic, mở rộng thử nghiệm sang các nhiệm vụ sáng tạo và dựa trên ngôn ngữ liên quan đến đa phương tiện và các bài tập dựa trên văn học. Trong các trường hợp này, các đánh giá do AI tạo ra cho thấy mối tương quan mạnh mẽ với điểm số của các chuyên gia con người, củng cố khả năng ứng dụng của hệ thống này vượt ra ngoài các tình huống làm việc nhóm có cấu trúc để vào các lĩnh vực sáng tạo mở hơn.

Các hệ thống dựa trên mô phỏng như vậy có thể được tích hợp vào môi trường giáo dục như một lớp đánh giá bổ sung bên cạnh các phương pháp đánh giá truyền thống trong tương lai gần. Điều này sẽ cho phép học sinh được đánh giá không chỉ dựa trên kiến thức môn học mà còn trên các kỹ năng liên cá nhân và nhận thức được áp dụng trong các môi trường mô phỏng kiểm soát. Mục tiêu rộng hơn của nghiên cứu là làm cho các năng lực sẵn sàng cho tương lai trở nên đo lường được quy mô lớn hơn và phù hợp hơn với yêu cầu của lực lượng lao động đang tiến hóa.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim