Công cụ học máy mới giúp khám phá các microprotein liên quan đến bệnh tật

Các nhà nghiên cứu tại Viện Salk đã phát triển một công cụ học máy mới có tên gọi ShortStop, giúp khám phá và xác định các vùng DNA bị bỏ qua trong quá trình tìm kiếm các microprotein có thể đóng vai trò quan trọng trong bệnh tật. Công cụ này cho phép các nhà khoa học xác định các vùng DNA có khả năng mã hóa microprotein và dự đoán khả năng sinh học của chúng, giúp tiết kiệm thời gian và tiền bạc trong quá trình nghiên cứu.
ShortStop hoạt động dựa trên việc phân loại microprotein thành hai loại: chức năng và không chức năng. Việc phân loại này được thực hiện dựa trên dữ liệu huấn luyện từ các bộ dữ liệu ngẫu nhiên được tạo ra bởi máy tính. Công cụ này so sánh các microprotein tìm thấy với các mẫu giả để nhanh chóng quyết định liệu một microprotein mới có khả năng chức năng hay không.
Khi áp dụng ShortStop vào một bộ dữ liệu đã được công bố trước đó, các nhà nghiên cứu đã xác định được 8% microprotein có khả năng chức năng, ưu tiên chúng cho việc theo dõi tiếp theo. Công cụ này cũng giúp xác định các microprotein bị bỏ qua bởi các phương pháp khác, bao gồm cả một microprotein đã được xác nhận bằng cách phát hiện trong các tế bào và mô của con người.
ShortStop đã được sử dụng để phân tích dữ liệu di truyền từ các khối u phổi của con người và mô lân cận bình thường để tạo ra danh sách các microprotein tiềm năng chức năng. Trong số các microprotein mà ShortStop tìm thấy, một số nổi bật đã được biểu hiện nhiều hơn trong mô khối u hơn mô bình thường, cho thấy chúng có thể đóng vai trò là dấu ấn sinh học hoặc microprotein chức năng cho ung thư phổi.
Việc xác định microprotein liên quan đến ung thư phổi này chứng minh giá trị của ShortStop và học máy trong việc ưu tiên các ứng viên cho nghiên cứu và phát triển điều trị trong tương lai. Các nhà nghiên cứu hy vọng rằng ShortStop sẽ giúp họ tìm ra các microprotein mới liên quan đến sức khỏe và bệnh tật, từ đó mở ra những con đường mới cho việc chẩn đoán và điều trị các bệnh như ung thư và Alzheimer.
Thông tin chi tiết về nghiên cứu này có thể được tìm thấy trên trang web của Viện Salk: https://salk.edu/