further improvement in approximating the maximum duo
play

Further Improvement in Approximating the Maximum - PowerPoint PPT Presentation

Further Improvement in Approximating the Maximum Duo-Preservation String Mapping Problem Brian Brubach University of Maryland, College Park 16 th Workshop on


  1. Further ¡Improvement ¡in ¡Approximating ¡the ¡ Maximum ¡Duo-­‑Preservation ¡String ¡ Mapping ¡Problem ¡ Brian ¡Brubach ¡ University ¡of ¡Maryland, ¡College ¡Park ¡ 16 th ¡Workshop ¡on ¡Algorithms ¡in ¡BioinformaAcs ¡– ¡WABI ¡2016 ¡

  2. Nicknames ¡ • Maximum ¡Duo-­‑preservaAon ¡String ¡Mapping ¡ problem ¡(MPSM) ¡ – Duo-­‑preservaAon ¡problem ¡ • Minimum ¡Common ¡String ¡ParAAon ¡problem ¡ (MCSP) ¡ – String ¡ParAAon ¡problem ¡ • The ¡aroncyms ¡for ¡tehse ¡plorebms ¡are ¡aslo ¡ hrad ¡to ¡tlel ¡arapt ¡ – Yuor ¡bairn ¡can ¡slove ¡tshee ¡pbroelms ¡

  3. Motivations ¡ • Comparing ¡biological ¡sequences ¡which ¡differ ¡ due ¡to ¡some ¡process ¡of ¡rearrangements ¡ • A ¡Linear ¡Time ¡Approxima.on ¡Algorithm ¡for ¡ the ¡DCJ ¡Distance ¡for ¡Genomes ¡with ¡Bounded ¡ Number ¡of ¡Duplicates ¡ – Rubert, ¡Feijão, ¡Braga, ¡Stoye, ¡MarAnez ¡(WABI ¡‘16) ¡ – UAlizes ¡an ¡approximaAon ¡algorithm ¡for ¡MCSP ¡ • Data ¡compression ¡of ¡similar ¡strings ¡using ¡ rearrangements ¡

  4. Max ¡Duo-­‑preservation ¡String ¡ Mapping ¡Problem ¡(MPSM) ¡ • Input: ¡two ¡strings ¡which ¡are ¡permutaAons ¡of ¡each ¡other ¡ A: ¡ a ¡ b ¡ c ¡ d ¡ d ¡ c ¡ b ¡ a ¡ B: ¡ b ¡ c ¡ a ¡ d ¡ d ¡ c ¡ a ¡ b ¡

  5. Max ¡Duo-­‑preservation ¡String ¡ Mapping ¡Problem ¡(MPSM) ¡ • Input: ¡two ¡strings ¡which ¡are ¡permutaAons ¡of ¡each ¡other ¡ • Goal: ¡a ¡one-­‑to-­‑one ¡mapping ¡that ¡preserves ¡the ¡maximum ¡ number ¡of ¡duos ¡ A: ¡ a ¡ b ¡ c ¡ d ¡ d ¡ c ¡ b ¡ a ¡ B: ¡ b ¡ c ¡ a ¡ d ¡ d ¡ c ¡ a ¡ b ¡

  6. Max ¡Duo-­‑preservation ¡String ¡ Mapping ¡Problem ¡(MPSM) ¡ • Input: ¡two ¡strings ¡which ¡are ¡permutaAons ¡of ¡each ¡other ¡ • Goal: ¡a ¡one-­‑to-­‑one ¡mapping ¡that ¡preserves ¡the ¡maximum ¡ number ¡of ¡duos ¡ • A ¡duo ¡is ¡a ¡pair ¡of ¡consecuAve ¡leYers ¡in ¡a ¡string ¡ A: ¡ a ¡ b ¡ c ¡ d ¡ d ¡ c ¡ b ¡ a ¡ B: ¡ b ¡ c ¡ a ¡ d ¡ d ¡ c ¡ a ¡ b ¡

  7. Max ¡Duo-­‑preservation ¡String ¡ Mapping ¡Problem ¡(MPSM) ¡ • Input: ¡two ¡strings ¡which ¡are ¡permutaAons ¡of ¡each ¡other ¡ • Goal: ¡a ¡one-­‑to-­‑one ¡mapping ¡that ¡preserves ¡the ¡maximum ¡ number ¡of ¡duos ¡ • A ¡duo ¡is ¡a ¡pair ¡of ¡consecuAve ¡leYers ¡in ¡a ¡string ¡ • A ¡duo ¡is ¡preserved ¡if ¡it’s ¡leYers ¡are ¡mapped ¡to ¡some ¡idenAcal ¡ duo ¡in ¡the ¡other ¡string ¡ 3 ¡duos ¡preserved ¡ A: ¡ a ¡ b ¡ c ¡ d ¡ d ¡ c ¡ b ¡ a ¡ B: ¡ b ¡ c ¡ a ¡ d ¡ d ¡ c ¡ a ¡ b ¡

  8. Max ¡Duo-­‑preservation ¡String ¡ Mapping ¡Problem ¡(MPSM) ¡ • Complement ¡of ¡the ¡well-­‑studied ¡Minimum ¡Common ¡String ¡ ParAAon ¡problem ¡(MCSP) ¡ 3 ¡duos ¡preserved ¡ A: ¡ a ¡ b ¡ c ¡ d ¡ d ¡ c ¡ b ¡ a ¡ B: ¡ b ¡ c ¡ a ¡ d ¡ d ¡ c ¡ a ¡ b ¡

  9. Max ¡Duo-­‑preservation ¡String ¡ Mapping ¡Problem ¡(MPSM) ¡ • Complement ¡of ¡the ¡well-­‑studied ¡Minimum ¡Common ¡String ¡ ParAAon ¡problem ¡(MCSP) ¡ – Separate ¡the ¡strings ¡into ¡idenAcal ¡parAAons ¡of ¡min ¡cardinality ¡ 5 ¡substrings ¡ 3 ¡duos ¡preserved ¡ A: ¡ a ¡ b ¡ c ¡ d ¡ d ¡ c ¡ b ¡ a ¡ B: ¡ b ¡ c ¡ a ¡ d ¡ d ¡ c ¡ a ¡ b ¡

  10. Max ¡Duo-­‑preservation ¡String ¡ Mapping ¡Problem ¡(MPSM) ¡ • Complement ¡of ¡the ¡well-­‑studied ¡Minimum ¡Common ¡String ¡ ParAAon ¡problem ¡(MCSP) ¡ – Separate ¡the ¡strings ¡into ¡idenAcal ¡parAAons ¡of ¡min ¡cardinality ¡ 5 ¡+ ¡3 ¡= ¡length ¡ 5 ¡substrings ¡ 3 ¡duos ¡preserved ¡ A: ¡ a ¡ b ¡ c ¡ d ¡ d ¡ c ¡ b ¡ a ¡ B: ¡ b ¡ c ¡ a ¡ d ¡ d ¡ c ¡ a ¡ b ¡

  11. Max ¡Duo-­‑preservation ¡String ¡ Mapping ¡Problem ¡(MPSM) ¡ • Complement ¡of ¡the ¡well-­‑studied ¡Minimum ¡Common ¡String ¡ ParAAon ¡problem ¡(MCSP) ¡ – Separate ¡the ¡strings ¡into ¡idenAcal ¡parAAons ¡of ¡min ¡cardinality ¡ • In ¡the ¡ k -­‑MPSM ¡and ¡ k -­‑MCSP ¡problems, ¡each ¡leYer ¡occurs ¡at ¡ most ¡ k ¡Ames ¡in ¡each ¡string ¡ 5 ¡+ ¡3 ¡= ¡length ¡ 5 ¡substrings ¡ 3 ¡duos ¡preserved ¡ A: ¡ a ¡ b ¡ c ¡ d ¡ d ¡ c ¡ b ¡ a ¡ B: ¡ b ¡ c ¡ a ¡ d ¡ d ¡ c ¡ a ¡ b ¡

  12. Related ¡Work ¡ Problem ¡ Approx. ¡ Authors/year ¡ Chen, ¡Chen, ¡Samatova, ¡Peng ¡Wang, ¡ k -­‑MPSM ¡ k 2 ¡ and ¡Tang ¡(2014) ¡ Boria, ¡Kurpisz, ¡Leppänen, ¡and ¡ 4 ¡ Mastrolilli ¡(2014) ¡ MPSM ¡ Boria, ¡Cabodi, ¡CamuraA, ¡Palena, ¡ 3.5 ¡ Pasini, ¡and ¡Quer ¡(2016) ¡ 3.25 ¡ This ¡paper ¡(2016) ¡ O(log ¡n ¡log*n) ¡ Cormode ¡and ¡Muthukrishnan ¡(2002) ¡ MCSP ¡ (edit ¡distance ¡with ¡moves ¡problem) ¡

  13. Hardness ¡ • 2-­‑MCSP ¡is ¡NP-­‑hard ¡and ¡APX-­‑hard ¡ – Goldstein, ¡Kolman, ¡and ¡Zheng ¡(2004) ¡ – Implies ¡Duo-­‑preservaAon ¡is ¡also ¡NP-­‑hard ¡ • 2-­‑MPSM ¡is ¡APX-­‑hard ¡ – Boria, ¡Kurpisz, ¡Leppänen, ¡and ¡Mastrolilli ¡(2014) ¡

  14. Other ¡Related ¡Work ¡ • Fixed ¡parameter ¡tractability ¡(FPT) ¡ – Duo-­‑preservaAon ¡is ¡FPT ¡when ¡parameterized ¡by ¡ number ¡of ¡preserved ¡duos ¡ • BereYa, ¡Castelli, ¡Dondi ¡(2015) ¡ • HeurisAcs ¡(for ¡String ¡ParAAon) ¡ – Blum, ¡Lozano, ¡Davidson ¡(2015) ¡ – Ferdous, ¡Rahman ¡(2015) ¡ • ApplicaAons ¡(for ¡String ¡ParAAon) ¡ – Chen, ¡Zheng, ¡Fu, ¡Nan, ¡Zhong, ¡Lonardi, ¡Jiang ¡(2005) ¡ – Swenson, ¡Marron, ¡Earnest-­‑deyoung, ¡Moret ¡(2005) ¡

  15. Duo ¡Mapping ¡and ¡ConFlicts ¡ • Consider ¡a ¡biparAte ¡graph ¡on ¡duos ¡ – Add ¡edges ¡between ¡idenAcal ¡duos ¡ – Max ¡matching ¡is ¡upper ¡bound ¡on ¡max ¡duo-­‑preservaAon ¡ ta ¡ at ¡ tc ¡ ct ¡ aa ¡ t ¡ c ¡ t ¡ A: ¡ a ¡ a ¡ a ¡ t ¡ B: ¡ a ¡ t ¡ a ¡ a ¡ c ¡ at ¡ at ¡ ta ¡ aa ¡ tc ¡

  16. Duo ¡Mapping ¡and ¡ConFlicts ¡ • Consider ¡a ¡biparAte ¡graph ¡on ¡duos ¡ – Add ¡edges ¡between ¡idenAcal ¡duos ¡ – Max ¡matching ¡is ¡upper ¡bound ¡on ¡max ¡duo-­‑preservaAon ¡ • Two ¡types ¡of ¡conflicts: ¡ ta ¡ at ¡ tc ¡ ct ¡ aa ¡ t ¡ c ¡ t ¡ A: ¡ a ¡ a ¡ a ¡ t ¡ B: ¡ a ¡ t ¡ a ¡ a ¡ c ¡ at ¡ at ¡ ta ¡ aa ¡ tc ¡

  17. Duo ¡Mapping ¡and ¡ConFlicts ¡ • Consider ¡a ¡biparAte ¡graph ¡on ¡duos ¡ – Add ¡edges ¡between ¡idenAcal ¡duos ¡ – Max ¡matching ¡is ¡upper ¡bound ¡on ¡max ¡duo-­‑preservaAon ¡ • Two ¡types ¡of ¡conflicts: ¡ – Type ¡1: ¡two ¡edges ¡to ¡the ¡same ¡duo ¡ ta ¡ at ¡ tc ¡ ct ¡ aa ¡ t ¡ c ¡ t ¡ A: ¡ a ¡ a ¡ a ¡ t ¡ B: ¡ a ¡ t ¡ a ¡ a ¡ c ¡ at ¡ at ¡ ta ¡ aa ¡ tc ¡

  18. Duo ¡Mapping ¡and ¡ConFlicts ¡ • Consider ¡a ¡biparAte ¡graph ¡on ¡duos ¡ – Add ¡edges ¡between ¡idenAcal ¡duos ¡ – Max ¡matching ¡is ¡upper ¡bound ¡on ¡max ¡duo-­‑preservaAon ¡ • Two ¡types ¡of ¡conflicts: ¡ – Type ¡1: ¡two ¡edges ¡to ¡the ¡same ¡duo ¡ – Type ¡2: ¡from ¡consecuAve ¡duos ¡to ¡non-­‑consecuAve ¡duos ¡ ta ¡ at ¡ tc ¡ ct ¡ aa ¡ t ¡ c ¡ t ¡ A: ¡ a ¡ a ¡ a ¡ t ¡ B: ¡ a ¡ t ¡ a ¡ a ¡ c ¡ at ¡ at ¡ ta ¡ aa ¡ tc ¡

  19. Main ¡Contributions ¡ • New ¡way ¡to ¡construct ¡a ¡duo ¡matching ¡ – First ¡find ¡weighted ¡matching ¡on ¡triplets ¡ – Translate ¡to ¡a ¡fracAonal ¡duo ¡matching ¡ – Gives ¡a ¡Aghter ¡upper ¡bound ¡ • New ¡method ¡for ¡resolving ¡conflicts ¡ – Based ¡on ¡local ¡graph ¡structures ¡

Download Presentation
Download Policy: The content available on the website is offered to you 'AS IS' for your personal information and use only. It cannot be commercialized, licensed, or distributed on other websites without prior consent from the author. To download a presentation, simply click this link. If you encounter any difficulties during the download process, it's possible that the publisher has removed the file from their server.

Recommend


More recommend