Bài viết này cung cấp hướng dẫn chi tiết từng bước về cách cài đặt và sử dụng các plugin BioGRID và BioGateway cho phần mềm Cytoscape. Bạn sẽ học cách nhập dữ liệu tương tác sinh học từ cơ sở dữ liệu BioGRID, xây dựng truy vấn phức tạp với BioGateway, và trực quan hóa mạng lưới tương tác một cách hiệu quả. Việc nắm vững các công cụ này sẽ giúp bạn nâng cao khả năng phân tích và hiểu sâu hơn về các quá trình sinh học phức tạp.
Plugin BioGRID cho phép bạn dễ dàng nhập dữ liệu tương tác từ các tập tin BioGRID .tab vào Cytoscape. Nó hỗ trợ nhập nhiều bằng chứng tương tác (evidences) dưới dạng một cạnh duy nhất với nhiều chú thích về mã bằng chứng và ấn phẩm. Plugin này đặc biệt hữu ích cho những ai muốn tận dụng kho dữ liệu tương tác phong phú của BioGRID để xây dựng và phân tích mạng lưới sinh học.
.jar
của plugin vào thư mục plugins của Cytoscape (ví dụ: /Cytoscape_x.x.x/plugins
)..tab
bạn đã tải từ BioGRID.Sau khi nhập dữ liệu BioGRID, các nút và cạnh trong mạng lưới Cytoscape sẽ có các thuộc tính quan trọng sau:
ID
: Giá trị từ cột INTERACTOR_A hoặc INTERACTOR_B của tập tin .tab
.biogrid.OFFICIAL_SYMBOL
: Giá trị từ cột OFFICIAL_SYMBOL_A hoặc OFFICIAL_SYMBOL_B.biogrid.ALIASES
: Danh sách các bí danh gene/protein từ cột ALIASES_FOR_A hoặc ALIASES_FOR_B.ID
: IDs của các nút kết nối, phân tách bằng "(pp)".biogrid.EXPERIMENTAL_SYSTEM
: Danh sách các hệ thống thí nghiệm từ cột EXPERIMENTAL_SYSTEM.biogrid.PUBMED_ID
: Danh sách các PubMed IDs từ cột PUBMED_ID.biogrid.SOURCE
: Danh sách các nguồn từ cột SOURCE.biogrid.INTERACTION_TYPE
: "Physical", "Genetic", hoặc "PhysicalANDGenetic" dựa trên hệ thống thí nghiệm.biogrid.NUMBER_OF_EXPERIMENTAL_SYSTEMS
: Số lượng hệ thống thí nghiệm.biogrid.NUMBER_OF_PMIDS
: Số lượng PubMed IDs.biogrid.TOTAL_RAW
: Số lượng dòng trong tập tin .tab
tương ứng với cạnh này.BioGateway Plugin cung cấp một giao diện mạnh mẽ để truy vấn cơ sở dữ liệu đồ thị RDF và khám phá các mạng lưới tương tác phức tạp. Bạn có thể xây dựng các truy vấn từng bước, sử dụng ngôn ngữ truy vấn SPARQL để xác định các nút và mối quan hệ mong muốn. Plugin này đặc biệt hữu ích cho việc khám phá các kết nối ẩn và hiểu rõ hơn về các quá trình sinh học.
BioGateway sử dụng SPARQL để truy vấn dữ liệu. Một truy vấn bao gồm các bộ ba (triple) gồm chủ thể (subject), vị ngữ (predicate) và đối tượng (object). Chủ thể và đối tượng là các nút, còn vị ngữ là loại quan hệ giữa chúng. Plugin cho phép bạn xây dựng truy vấn bằng cách chỉ định các nút và mối quan hệ cụ thể, hoặc sử dụng "Sets" để đại diện cho tập hợp các giá trị thỏa mãn điều kiện truy vấn.
Ví dụ, truy vấn ?animal kept_as Pet
sẽ trả về tất cả các động vật được nuôi làm thú cưng. Bạn có thể thêm các điều kiện khác để thu hẹp kết quả, ví dụ ?animal moves_by Walking
để chỉ lấy các thú cưng đi bộ.
Query Builder trong BioGateway giúp bạn xây dựng truy vấn từng bước một cách trực quan. Bạn có thể tải các ví dụ truy vấn có sẵn để làm quen với cú pháp và cách sử dụng. Ví dụ, "Example 1a" truy vấn tất cả các gene là mục tiêu điều khiển phiên mã của protein FOXO4 và tất cả các protein liên quan đến quá trình sinh học "response to hypoxia".
Bạn có thể kết hợp nhiều dòng truy vấn để xây dựng các truy vấn phức tạp hơn. Lưu ý rằng gene và protein là các thực thể khác nhau trong BioGateway.
Bằng cách nắm vững các plugin BioGRID và BioGateway, bạn có thể khai thác tối đa tiềm năng của Cytoscape để phân tích và trực quan hóa dữ liệu tương tác sinh học, từ đó đóng góp vào các nghiên cứu khoa học quan trọng.
Bài viết liên quan