Bu çalışmada, küçük hücreli akciğer karsinomunda farmakogenomik etkileşimleri analiz edilmiştir. Bu analiz sonucunda ilaçların mutasyon yüküne bağlı olarak duyarlılığını makine öğrenmesi yöntemleri ile tahmin edilmesini sağlayacak veri toplama, manipülasyon ve model geliştirme süreçleri yapılmıştır. Sanger Enstitüsü tarafından sunulan açık kaynaklı üç ayrı veri kümesi birleştirilerek yeni bir veri kümesi türetilmiştir. İlk veri kaynağı hücre hatları ve bunların mutasyon bilgilerini içermektedir. İkinci veri kaynağı hücre hatlarına ait detaylı bilgileri içermektedir. Üçüncü veri kaynağı ise ilaç-hücre etkileşimlerini ve hücre hatlarına karşı ilaç duyarlılığını içermektedir. Birleştirilen verilerden farklı mutasyon yük bilgilerinin sayılarak ilaç bileşikleri, hücre hatları, mutasyon yükleri, doku ve IC50 özellikleri tek bir veri kümesinde toplanmıştır. Çalışmanın ikinci aşamasında, türetilen veri makine öğrenmesinde kullanılmış ve mutasyon yüküne göre ilaç direnci etkisi tahmin edilmiştir. Bu amaçla, tahmin için üç farklı makine öğrenmesi algoritması test edilmiştir. Makine öğrenmesi performans analizi için RMSE, R2 ve MAE sonuçları bulunmuş ve karşılaştırılmıştır. Elde edilen sonuçlara göre geliştirdiğimiz XGBoost makine öğrenmesi modeli hücre-ilaç arasındaki IC50 skorunu anlamlı oranda tahmin etmiştir. Bu sayede ilaçların mutasyonlara direncine ve etkisine dair ön bilgi sunulmaktadır. Bunun yanı sıra çalışmada hangi mutasyon türlerinin nicel sayısının ilaç direncinde daha fazla etki gösterdiğini makine öğrenmesi analizleri ile sunulmuştur.
İlaç Duyarlılığı Tahmini; Mutasyon Yükü ; Makine Öğrenme; Kişiselleştirilmiş Tıp; XGBoost İlaç duyarlılığı tahmini Mutasyon yükü Makine Öğrenmesi Kişiselleştirilmiş tıp
Etik Beyan gerektirecek bir konu yoktur. Bu çalışmada kullanılan verilerin tamamı açık kaymaklıdır.
In this study, we addressed pharmacogenomic interactions in lung small cell carcinoma. For this purpose, data collection, data manipulation and machine learning algorithms were utilized. By combining three open-source datasets, a new dataset is generated. The first data source contains cell lines and their mutation information. The second data source contains detailed information about the cell lines. The third dataset contains drug-cell interactions and drug sensitivity of cell lines. By combining the utilized data sources, a new dataset was obtained by counting different mutation load information. Thus, chemical compounds, cell lines, mutation loads, tissue and IC50 characteristics were collected in a single dataset. In the second phase of the study, the derived data were used in machine learning to predict the mutation load effect on drug resistance. For this purpose, three different machine learning algorithms were tested for prediction. For machine learning performance analysis, RMSE, R2 and MAE results were found and compared. According to the results, the XGBoost machine learning model we developed significantly predicts the IC50 score between cell-drug. In this way, it provides preliminary information on the extent to drug resistance and drug effect. In addition, the study presents which mutation types have a greater effect on the quantitative number of drug resistance through machine learning analysis.
Drug Sensitivity Prediction ; Mutational Burden Machine Learning Personalized Medicine XGBoost
Primary Language | Turkish |
---|---|
Subjects | Biomedical Engineering (Other) |
Journal Section | Articles |
Authors | |
Early Pub Date | May 22, 2025 |
Publication Date | June 10, 2025 |
Submission Date | September 26, 2024 |
Acceptance Date | December 4, 2024 |
Published in Issue | Year 2025 Volume: 25 Issue: 3 |
This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.