Công trình này được mô tả trong một bài báo mới đăng, “Giải hình học Olympic mà không cần sự chứng minh của con người”, xuất bản trên tạp chí Nature.
Công ty Google Deepmind cho biết họ đã tạo ra một hệ thống AI mới có thể giải các bài toán hình học mức độ khó hàng đầu ở trình độ học sinh trung học phổ thông.
Hình học là một trong những nhánh lâu đời nhất của toán học, nhưng đã được chứng minh là đặc biệt khó thích hợp đối với các hệ thống AI. Việc đào tạo AI rất khó khăn vì thiếu dữ liệu và để thành công đòi hỏi phải xây dựng một hệ thống có thể đương đầu với những thách thức logic khó khăn.
Thông thường, các kỹ sư đào tạo các hệ thống như vậy bằng cách sử dụng máy học, bao gồm việc cung cấp cho chúng dữ liệu về cách hoàn thành thành công một nhiệm vụ và yêu cầu chúng học cách thực hiện điều đó. Nhưng có rất ít chứng minh của con người như chứng minh các định lý, đặc biệt là trong hình học.
Thay vào đó, các nhà nghiên cứu cho biết họ đã sử dụng một cách tiếp cận khác để xây dựng hệ thống mới có tên AlphaGeometry. Họ sử dụng một mô hình ngôn ngữ có khả năng tự rèn luyện bằng cách tổng hợp hàng triệu định lý và cách chứng minh của chúng, sau đó kết hợp điều đó với một hệ thống có thể tìm kiếm thông qua các điểm phân nhánh trong các bài toán đầy thách thức.
Những người sáng tạo khẳng định, khi kết hợp lại với nhau, hệ thống đó có thể học và sau đó giải các bài toán hình học phức tạp mà không cần sự can thiệp của con người.
Nó đã được đưa vào thử nghiệm với 30 bài toán thi Olympic Toán học Quốc tế, một cuộc thi trong đó những học sinh trung học có thành tích cao nhất được yêu cầu chứng minh các định lý toán học. AlphaGeometr đã có thể giải được 25 bài trong số 30 bài đó.
Điều đó tốt hơn nhiều so với những phương pháp trước đó, vốn chỉ có thể giải quyết được 10 bài. Nó tiến gần đến mức trung bình của người đoạt huy chương vàng, người đã giải được 25,9 định lý.
Các nhà nghiên cứu cho biết hệ thống này cũng có thể cung cấp bằng chứng theo cách mà con người có thể hiểu được và thậm chí còn tìm ra phiên bản mới của một định lý.
Hiện tại, hệ thống chỉ có thể được sử dụng trên các loại hình học cụ thể. Nhưng các nhà nghiên cứu cho biết cuối cùng nó có thể được sử dụng trong các ngành toán học khác nhau.
Trong khi phần lớn sự phấn khích về AI gần đây tập trung vào các mô hình ngôn ngữ lớn như ChatGPT, Google Deepmind lại tập trung chủ yếu vào việc sử dụng trí tuệ nhân tạo một cách thực tế hơn. Điều đó bao gồm những đột phá gần đây trong ngành dự báo thời tiết và các phần khác của toán học như môn hình học.