Thiết kế protein
20 năm trước, David Baker (Đại học Washington, Mỹ) và các đồng nghiệp của ông đã đạt được thành tựu mang tính bước ngoặt khi sử dụng các công cụ tính toán để thiết kế một loại protein hoàn toàn mới.
Ngày nay, khả năng thiết kế protein mới đã được phát triển để tạo ra các enzyme và protein theo yêu cầu. Phần lớn sự tiến bộ đó xuất phát từ các bộ dữ liệu ngày càng lớn về liên kết chuỗi trong protein và cấu trúc, kết hợp với các phương pháp nghiên cứu học sâu phức tạp.
Sử dụng chiến lược dựa trên trình tự gen, các mô hình ngôn ngữ lớn với sự hỗ trợ của AI giúp xử lý các chuỗi protein. Nhà khoa học Noelia Ferruz thuộc Viện Sinh học Phân tử Barcelona (Tây Ban Nha) đã phát triển một thuật toán có tên ProtGPT2, có thể liên tục tạo ra các protein tổng hợp có khả năng gấp nếp ổn định khi được sản xuất trong phòng thí nghiệm.
Một công cụ khác do Ferruz và các đồng nghiệp phát triển, được gọi là ZymCTRL, dựa trên trình tự thành phần protein và dữ liệu chức năng để thiết kế các loại protein của các enzyme có trong tự nhiên, enzyme là chất xúc tác sinh học có thành phần cơ bản là protein.
Noelia Ferruz (Zaragoza, 1988) tốt nghiệp cử nhân Hóa học tại Đại học Zaragoza và tiến sĩ Sinh lý học điện toán tại Đại học Pompeu Fabra (Tây Ban Nha). Nghiên cứu sau tiến sĩ, cô đã triển khai mô hình trí tuệ nhân tạo đầu tiên cho phép “tạo ra các chuỗi protein chức năng có thể sử dụng trong điều trị bệnh hoặc giảm bớt tác động của biến đổi khí hậu”.
Kể từ năm 2023, cô là trưởng nhóm dẫn dắt nhóm nghiên cứu của Viện Sinh học Phân tử Barcelona thực hiện dự án “Giải mã ngôn ngữ protein: thiết kế protein theo yêu cầu”.
Khả năng chèn những đoạn DNA lớn
Từ cuối năm 2023, lần đầu tiên các cơ quan quản lý của Mỹ và Vương quốc Anh phê duyệt liệu pháp chỉnh sửa gen - CRISPR - đối với bệnh thiếu máu hồng cầu lưỡi liềm và bệnh Beta thalassemia phụ thuộc truyền máu (căn bệnh khiến bệnh nhân phải truyền máu định kỳ, nếu không sẽ có nhiều biến chứng và giảm tuổi thọ).
CRISPR và các dẫn xuất của nó sử dụng một đoạn RNA ngắn có thể được lập trình để điều hướng enzyme cắt DNA như Cas9 đến một vị trí gen cụ thể. Chúng thường được sử dụng trong phòng thí nghiệm để vô hiệu hóa các gen khiếm khuyết và tạo ra những thay đổi nhỏ về trình tự gen.
Việc chèn chính xác và có thể lập trình các chuỗi DNA lớn hơn bao gồm hàng nghìn nucleotide là rất khó, nhưng các giải pháp mới có thể cho phép các nhà khoa học thay thế các đoạn quan trọng của gen khiếm khuyết hoặc chèn các chuỗi gen đầy đủ chức năng.
Phó giáo sư-Tiến sĩ khoa học Le Cong - một nhà di truyền học phân tử tại Đại học Stanford (Mỹ) và các đồng nghiệp đã khám phá các protein ủ sợi đơn (SSAP - Single Strand Annealing Protein), là các phân tử có nguồn gốc từ virus làm trung gian cho quá trình tái tổ hợp DNA. Khi kết hợp với hệ thống CRISPR-Cas (trong đó chức năng cắt DNA của Cas9 đã bị vô hiệu hóa), các SSAP này cho phép chèn mục tiêu chính xác lên đến 2 kilobase DNA vào bộ gen của con người.
Bên cạnh đó, còn có phương pháp khác khai thác cách thức dựa trên CRISPR là chỉnh sửa gốc để đưa ra các chuỗi ngắn nhằm sàng lọc có chọn lọc các enzym để có thể ghép chính xác các đoạn DNA lớn vào bộ gen. Phương pháp này gọi là PASTE (Programmable Addition through Site-Specific Targeting Elements), có nhiều tiềm năng cho việc chỉnh sửa ngoài cơ thể (ex vivo) các tế bào được nuôi cấy và có nguồn gốc từ bệnh nhân.
Kết nối não với máy tính
Căn bệnh xơ cứng teo cơ một bên đã khiến Pat Bennett không thể diễn đạt bằng lời nói. Sau khi được điều trị, Bennett đã có sự phục hồi đáng chú ý khi nói được 62 từ mỗi phút với vốn từ vựng 125.000 từ (nhiều hơn gấp đôi vốn từ vựng của một người nói tiếng Anh trung bình).
Tất cả là nhờ vào một thiết bị kết nối não với máy tính (BCI - Brain Computer Interface) phức tạp được phát triển bởi nhà thần kinh học Francis Willett thuộc Đại học Stanford và các đồng nghiệp của ông tại Tập đoàn BrainGate, Mỹ.
Willett và các đồng nghiệp đã cấy các điện cực vào não của Bennett để theo dõi hoạt động của tế bào thần kinh, sau đó huấn luyện các thuật toán học sâu để chuyển những tín hiệu đó thành lời nói. Các nhà nghiên cứu cũng đang áp dụng những mô hình ngôn ngữ dựa trên AI để tăng tốc độ giải thích thông tin mà bệnh nhân đang cố gắng truyền đạt.
Bên cạnh tiềm năng điều trị các chứng suy giảm nhận thức, rối loạn tâm trạng, lĩnh vực này cũng đang chứng kiến sự tiến bộ trong việc hỗ trợ người bệnh di chuyển hoặc điều khiển các bộ phận trên cơ thể.
Xây dựng các tập bản đồ tế bào
Năm 2016, một dự án bản đồ tế bào người được thực hiện bởi nhà sinh học tế bào Sarah Teichmann tại Viện Wellcome Sanger (Vương quốc Anh), với sự tham gia của khoảng 3.000 nhà khoa học ở gần 100 quốc gia và 10.000 nhà tài trợ. Dự án này được thực hiện trong khoảng hơn một thập kỷ.
Đến tháng 6/2023, Sarah Teichmann công bố một bản phân tích tổng hợp gồm 49 bộ dữ liệu từ phổi của con người, thể hiện những thay đổi xảy ra đối với các bệnh như xơ phổi, u phổi hay Covid-19...
Tuy nhiên, vẫn còn rất nhiều công việc phải làm phía trước và ước tính phải mất ít nhất 5 năm nữa dự án bản đồ tế bào người mới hoàn thành. Chúng sẽ có giá trị to lớn trong nhiều lĩnh vực như y tế, chăm sóc sức khỏe, công nghệ gen...