当前位置 博文首页 > 文章内容

    LeetCode 187. 重复的DNA序列

    作者: 栏目:未分类 时间:2020-07-12 14:01:11

    本站于2023年9月4日。收到“大连君*****咨询有限公司”通知
    说我们IIS7站长博客,有一篇博文用了他们的图片。
    要求我们给他们一张图片6000元。要不然法院告我们

    为避免不必要的麻烦,IIS7站长博客,全站内容图片下架、并积极应诉
    博文内容全部不再显示,请需要相关资讯的站长朋友到必应搜索。谢谢!

    另祝:版权碰瓷诈骗团伙,早日弃暗投明。

    相关新闻:借版权之名、行诈骗之实,周某因犯诈骗罪被判处有期徒刑十一年六个月

    叹!百花齐放的时代,渐行渐远!



    所有 DNA 都由一系列缩写为 A,C,G 和 T 的核苷酸组成,例如:“ACGAATTCCG”。在研究 DNA 时,识别 DNA 中的重复序列有时会对研究非常有帮助。
    编写一个函数来查找目标子串,目标子串的长度为 10,且在 DNA 字符串 s 中出现次数超过一次。

    示例:
    输入:s = "AAAAACCCCCAAAAACCCCCCAAAAAGGGTTT"
    输出:["AAAAACCCCC", "CCCCCAAAAA"]

    class Solution:
        def findRepeatedDnaSequences(self, s: str) -> List[str]:
            cnt = 0
            substr_dict = {}
            while cnt+10 <= len(s):
                substr = s[cnt:cnt+10]
                cnt+=1
                if substr not in substr_dict:
                    substr_dict[substr] = 0
                substr_dict[substr]+=1
            ans = set()
            for substr in substr_dict:
                if substr_dict[substr]>1:
                    ans.add(substr)
    
            return list(ans)