Ben Kurtovic
b9324eb658
Fix Python tokenizer to not generate empty Text tokens.
11 роки тому
Ben Kurtovic
be505465c0
Alter a test that imitates strange (incorrect?) MediaWiki behavior.
11 роки тому
Ben Kurtovic
44ee185377
Fix some tests involving colons starting lines.
11 роки тому
Ben Kurtovic
176290d75a
Add a couple more tests.
11 роки тому
Ben Kurtovic
93c51fe57c
Tokenizer tests for external links.
11 роки тому
Ben Kurtovic
0ecf2e4231
Add a couple integration tests for ext links vs. <dl>.
11 роки тому
Ben Kurtovic
f3025eaafe
Fix some wikilink-related tests.
11 роки тому
Ben Kurtovic
cbf67c7842
Add hooks for some ext link stuff; add a INVALID_LINK aggregate context.
11 роки тому
Ben Kurtovic
be5d2cbb07
Support HTML entities inside parser-blacklisted tags ( closes #36 )
11 роки тому
Ben Kurtovic
9f579ec29f
Add a test for <nowiki /> before a list.
11 роки тому
Ben Kurtovic
d6446d5d90
Finish test coverage for tags.
11 роки тому
Ben Kurtovic
55202aadb0
Fix some broken tests.
11 роки тому
Ben Kurtovic
28fa6a2037
Add some tests and a new context.
11 роки тому
Ben Kurtovic
851a9e5863
Add a couple tests and fix a couple broken ones.
11 роки тому
Ben Kurtovic
dd2a6f913b
Add support for dt, dd. Refactor. Fix some broken tests.
11 роки тому
Ben Kurtovic
7bce2f4e96
Parse *, #; add another test.
11 роки тому
Ben Kurtovic
0de0a1f795
Finish expected results for wiki-markup test cases.
11 роки тому
Ben Kurtovic
81bafdb72f
Add 56 tokenizer tests for wiki-markup tags.
11 роки тому
Ben Kurtovic
f70188daa8
Add builder and tokenizer tests for wiki-markup tags.
11 роки тому
Ben Kurtovic
d02a6da81e
Implement Tokenizer_handle_tag_space(); refactor textbuffer writing.
- Add a test for very long strings of text.
11 роки тому
Ben Kurtovic
5018d9d323
Make showtag=True implicit.
11 роки тому
Ben Kurtovic
929fa25e1f
Correctly tokenize single-only HTML tags, part two.
11 роки тому
Ben Kurtovic
b24ddaea10
Tokenizer support for implicitly self-closing tags.
11 роки тому
Ben Kurtovic
d3a4078880
Tests for single and single_only tags.
11 роки тому
Ben Kurtovic
50beda0914
Improve/fix the way padding is handled.
11 роки тому
Ben Kurtovic
2a71c18892
Four tests for <nowiki> + friends.
11 роки тому
Ben Kurtovic
e5ada4753a
Adding a test for triple backslashes.
11 роки тому
Ben Kurtovic
ffb554c36f
Fix broken tests.
11 роки тому
Ben Kurtovic
4c7ed9c6a9
Add seven tests related to backslashes before quotes.
11 роки тому
Ben Kurtovic
17c71e335f
Add three tests for invalid attribute quote usage.
11 роки тому
Ben Kurtovic
dd6bb1637d
Support tag nesting properly; unit tests; recursion checks for tags.
11 роки тому
Ben Kurtovic
f63480bcf3
Update the integration.rich_tags test to use the new tag tokens.
Remove an now-unused import in the tokenizer.
11 роки тому
Ben Kurtovic
43e717cca9
Add a number of new tag tests.
11 роки тому
Ben Kurtovic
81e8fdd682
Give Attributes more attributes for padding data.
11 роки тому
Ben Kurtovic
ce27d5d385
Fix six failing tests; add three more (all passing).
11 роки тому
Ben Kurtovic
6450814729
Remove 'type' attribute from tags; rework tag definitions.
11 роки тому
Ben Kurtovic
03e41286c6
Add a number of tag tests. A couple of these are failing.
11 роки тому
Ben Kurtovic
9ea06c2830
Push the textbuffer to fix a couple broken tests.
11 роки тому
Ben Kurtovic
1b4c01b4c0
Implement assertTagNodeEqual(), start test_tag(), add to tags.mwtest.
11 роки тому
Ben Kurtovic
ec6ba67dbe
Tokenizer integration tests; finish unit test coverage ( closes #7 )
11 роки тому
Ben Kurtovic
6e2ca06ebe
Tokenizer tests for HTML entities.
11 роки тому
Ben Kurtovic
6070eff657
Tokenizer tests for headings. Also, add an integration test.
11 роки тому
Ben Kurtovic
dd199c4389
Fix tokenizer tests with setup.py test.
11 роки тому
Ben Kurtovic
9e527146c7
Tokenizer tests for comments.
11 роки тому
Ben Kurtovic
ebaa0e60b6
Tokenizer tests for wikilinks.
Also add one for arguments.
11 роки тому
Ben Kurtovic
db06eda8c0
Tokenizer tests for arguments.
Also add a couple for templates and one for integration.
11 роки тому
Ben Kurtovic
a0fb8361eb
Can specify specific tokenizer tests via the command line; add files
11 роки тому
Ben Kurtovic
9ede1121ba
Fix tokenizer.c on Windows; add another template test ( #25 )
Mostly by @gdooms , with tweaks.
11 роки тому
Ben Kurtovic
debcb6577e
Fix recursion issues by giving up at a certain point ( closes #16 ).
- Stop parsing new templates if the template depth gets above
MAX_DEPTH (40) or if we've already tried to parse over MAX_CYCLES
(100,000) templates.
- Add two tests to ensure recursion works somewhat correctly.
- Fix parsing the string "{{" with the Python tokenizer; add a test.
11 роки тому
Ben Kurtovic
5a0a00ba98
Change the way verify_safe() handles template params ( #25 ).
- Newlines are now allowed in template param names.
- Changes also affect handling of arguments like {{{foo}}}.
- Update unit tests: remove some unnecessary ones, and add some to cover the changes.
- Update StringMixIn tests to actually work for some of the methods.
- Update copyright notices for the C extensions.
11 роки тому