Ben Kurtovic
c238cfaac5
Fixing the return values of copyvios.main().
před 12 roky
Ben Kurtovic
704adb32b5
Fix path.
před 12 roky
Ben Kurtovic
b4b5ac4f93
Restructure into an actual package that makes sense.
před 12 roky
Ben Kurtovic
80e224d768
Move support.copyvios to copyvios
před 12 roky
Ben Kurtovic
9240124bde
Context cleanup.
před 12 roky
Ben Kurtovic
0f3414c576
Refactor the last bit of parsing code into support.copyvios.
Will clean up in a bit.
před 12 roky
Ben Kurtovic
2c89d9c5dd
Underscores in the names of everything "private".
před 12 roky
Ben Kurtovic
420a1708e0
Refactor get_site() to copyvios.mako directly instead of the checker.
před 12 roky
Ben Kurtovic
bed02a87f0
Relative imports
před 12 roky
Ben Kurtovic
f58465718e
Fixing contexts
před 12 roky
Ben Kurtovic
5bff019edc
Trying a radical restructuring...
před 12 roky
Ben Kurtovic
969badc4a3
Only display "bypass cache" option if the result was actually cached.
před 12 roky
Ben Kurtovic
bcb1756510
Check existence in a way that we won't make unnecessary queries.
před 12 roky
Ben Kurtovic
41165fcdac
Only escape site names if they contain characters outside of the BMP.
Also doing some cleanup.
před 12 roky
Ben Kurtovic
b0a6da8b36
Ignore fishbowl wikis, because we can't log in to them.
před 12 roky
Ben Kurtovic
1368a19a19
Support for closed or private wikis where we can't create an account.
před 12 roky
Ben Kurtovic
4e747f0f10
A couple more fixes.
před 12 roky
Ben Kurtovic
2b82bd29d2
Fix another Site bug.
před 12 roky
Ben Kurtovic
8345559b3e
Missed the required result.cached attribute.
před 12 roky
Ben Kurtovic
a23a39950a
Apparently some special sites have no subdomain?
před 12 roky
Ben Kurtovic
d93661f8f4
Organize query string parsing better.
před 12 roky
Ben Kurtovic
36c6c75519
Make things make more sense when working with special sites.
před 12 roky
Ben Kurtovic
b943db2796
Accidentally b0rked that tuple a bit...
před 12 roky
Ben Kurtovic
99f75be9ee
Store site names escaped to get around MySQL 5.1 unicode limitation.
před 12 roky
Ben Kurtovic
32e5fe1376
Collate as utf8_unicode_ci
před 12 roky
Ben Kurtovic
4003711724
Forgot we can't iterate over cursor.execute()...
před 12 roky
Ben Kurtovic
fb47c54cfb
Missed a continue.
před 12 roky
Ben Kurtovic
314663a5e2
time_since_update when no updates have occured should not be zero!
před 12 roky
Ben Kurtovic
744c1f0507
Mixed up a Bot and a Site somewhere...
před 12 roky
Ben Kurtovic
a64eac6214
Fix imports?
před 12 roky
Ben Kurtovic
1846a895a2
Missed a closing bracket.
před 12 roky
Ben Kurtovic
4057c878df
Adding schema file for the MySQL database.
před 12 roky
Ben Kurtovic
910e839c14
Make updating work with a completely empty database.
před 12 roky
Ben Kurtovic
17fdf4a142
Rename languages and projects tables to their singular equivalents.
před 12 roky
Ben Kurtovic
dcd53d0f66
Be smarter about Unicode!
před 12 roky
Ben Kurtovic
bab8bff6ad
Hopefully make the dropdown menus clearer.
před 12 roky
Ben Kurtovic
f644208f05
Implement missing cases, plus closing a few Unicode loopholes.
před 12 roky
Ben Kurtovic
b8d5376020
Support special sites (e.g. Commons, Meta) Part II; cleanup
před 12 roky
Ben Kurtovic
7d7393ad54
Support special sites (e.g. Commons, Meta) Part I
před 12 roky
Ben Kurtovic
ecc5a13cf5
Dynamically load sites from the API and cache this information.
- Also removing some unused imports and cleaning up code.
před 12 roky
Ben Kurtovic
66122c147f
Try to clarify the optionality of giving a URL.
před 12 roky
Ben Kurtovic
23cb80014c
Support for Duplication Detector-like behavior.
- Implement a &url= parameter and get_url_specific_results().
- Update tool description.
- Increase text box widths.
- "Markov chain size" -> "Trigrams"
- Don't show "The WMF paid Yahoo $X" if $X is $0.
před 12 roky
Ben Kurtovic
d1be6b55df
Replace the actual checker with a dummy.
This allows us to play around with the interface without actually
running checks just yet.
před 12 roky
Ben Kurtovic
e27321d2ea
Try to fix these bugs in earwigbot.mako.
před 12 roky
Ben Kurtovic
fa16d5eff7
highlight_delta() should work with trigrams
před 12 roky
Ben Kurtovic
c368540fba
Some updates for the new version of EarwigBot.
Still have to update bigrams to trigrams.
před 12 roky
Ben Kurtovic
7d464bf141
Update LICENSE
před 12 roky
Ben Kurtovic
c49119ea97
Protocol-relative URLs in some places for full HTTPS support
před 12 roky
Ben Kurtovic
7d92f7a76b
Copyvio detection interface is (mostly) done.
před 12 roky
Ben Kurtovic
910a24a89f
Minor updates.
před 12 roky