Преглед на файлове

Also strip out files and categories in ATP.strip().

tags/v0.2
Ben Kurtovic преди 9 години
родител
ревизия
6b146a397a
променени са 1 файла, в които са добавени 7 реда и са изтрити 0 реда
  1. +7
    -0
      earwigbot/wiki/copyvios/parsers.py

+ 7
- 0
earwigbot/wiki/copyvios/parsers.py Целия файл

@@ -63,6 +63,13 @@ class ArticleTextParser(BaseTextParser):
The actual stripping is handled by :py:mod:`mwparserfromhell`.
"""
wikicode = mwparserfromhell.parse(self.text)

# Preemtively strip some links mwparser doesn't know about:
bad_prefixes = ("file:", "image:", "category:")
for link in wikicode.filter_wikilinks():
if link.title.strip().lower().startswith(bad_prefixes):
wikicode.remove(link)

clean = wikicode.strip_code(normalize=True, collapse=True)
self.clean = clean.replace("\n\n", "\n").strip()
return self.clean


Зареждане…
Отказ
Запис