Spaces:

PharC
/

FasterPrimer

Sleeping

App Files Files Community

PharC commited on Jan 4

Commit

b16b331

verified ·

1 Parent(s): 0c0b2b6

Update app.py

Browse files

Files changed (1) hide show

app.py +18 -28

app.py CHANGED Viewed

@@ -12,39 +12,30 @@ app = Flask(__name__)
 ssl._create_default_https_context = ssl._create_unverified_context
 def get_ready_for_primers(gene_symbol, species="human"):
     Entrez.email = "your_email@example.com"
-    try:
-        # 1. 搜索基因 ID (保持不变)
-        search_term = f"{gene_symbol}[Gene Name] AND {species}[Organism] AND alive[prop]"
-        handle = Entrez.esearch(db="gene", term=search_term)
-        record = Entrez.read(handle)
-        if not record["IdList"]:
-            return {"error": f"未找到基因: {gene_symbol}"}
-        gene_id = record["IdList"][0]
-        # 2. 获取核苷酸 ID
-        # 核心修复点：使用 "refseq[filter] AND RNA[filter]"
-        # 这会同时命中 NM_ (mRNA) 和 NR_ (ncRNA)，且排除掉染色体大片段
-        link_handle = Entrez.elink(
-            dbfrom="gene",
-            db="nucleotide",
-            id=gene_id,
-            term="refseq[filter] AND RNA[filter]"
-        )
-        link_record = Entrez.read(link_handle)
-        # 检查是否有返回结果，防止 list index out of range
-        if not link_record[0]["LinkSetDb"]:
-            return {"error": f"基因 {gene_symbol} 找不到标准的 RefSeq 转录本"}
         nucl_id = link_record[0]["LinkSetDb"][0]["Link"][0]["Id"]
-        # 3. 下载并解析 (恢复你最开始的版本)
         handle = Entrez.efetch(db="nucleotide", id=nucl_id, rettype="gb", retmode="text")
         seq_record = SeqIO.read(handle, "genbank")
-        # 4. 提取外显子
         junctions = []
         current_pos = 0
         for feature in seq_record.features:
@@ -54,7 +45,7 @@ def get_ready_for_primers(gene_symbol, species="human"):
                 junctions.append(int(current_pos))
         if junctions:
-            junctions.pop() # 最后一个点不是交界点
         return {
             "symbol": gene_symbol,
@@ -63,8 +54,7 @@ def get_ready_for_primers(gene_symbol, species="human"):
             "junctions": junctions
         }
     except Exception as e:
-        # 这里的报错能帮我们准确定位是哪一步出的错
-        return {"error": f"获取 {gene_symbol} 失败: {str(e)}"}
 def design_qpcr_primers(gene_data):
     """设计qPCR引物，包含失败重试机制"""

 ssl._create_default_https_context = ssl._create_unverified_context
 def get_ready_for_primers(gene_symbol, species="human"):
+    """获取基因序列和外显子交界点信息"""
     Entrez.email = "your_email@example.com"
+    # 1. 搜索基因并获取 NCBI 内部 ID
+    search_term = f"{gene_symbol}[Gene Name] AND {species}[Organism]"
+    handle = Entrez.esearch(db="gene", term=search_term)
+    record = Entrez.read(handle)
+    if not record["IdList"]:
+        return {"error": "未找到该基因"}
+    gene_id = record["IdList"][0]
+    # 2. 获取该基因关联的 NM_ 编号
+    link_handle = Entrez.elink(dbfrom="gene", db="nucleotide", id=gene_id, term="srcdb_refseq[prop] AND mRNA[filter]")
+    link_record = Entrez.read(link_handle)
+    try:
+        # 获取第一个关联的核苷酸 UID
         nucl_id = link_record[0]["LinkSetDb"][0]["Link"][0]["Id"]
+        # 3. 下载完整的 GenBank 格式数据
         handle = Entrez.efetch(db="nucleotide", id=nucl_id, rettype="gb", retmode="text")
         seq_record = SeqIO.read(handle, "genbank")
+        # 提取外显子分界点
         junctions = []
         current_pos = 0
         for feature in seq_record.features:
                 junctions.append(int(current_pos))
         if junctions:
+            junctions.pop()  # 移除最后一个边界
         return {
             "symbol": gene_symbol,
             "junctions": junctions
         }
     except Exception as e:
+        return {"error": f"获取基因信息失败: {str(e)}"}
 def design_qpcr_primers(gene_data):
     """设计qPCR引物，包含失败重试机制"""