Ben
a689467577
Replace broken log2 function; add a missing comment.
преди 11 години
Ben Kurtovic
22e869b142
Fix a failing HTML entity test in the C tokenizer.
Remove some extraneous whitespace in string_mixin.py.
преди 11 години
Ben Kurtovic
496475c977
Whoops, that should be one larger ( #25 ).
преди 11 години
Ben Kurtovic
9ede1121ba
Fix tokenizer.c on Windows; add another template test ( #25 )
Mostly by @gdooms , with tweaks.
преди 11 години
Ben Kurtovic
debcb6577e
Fix recursion issues by giving up at a certain point ( closes #16 ).
- Stop parsing new templates if the template depth gets above
MAX_DEPTH (40) or if we've already tried to parse over MAX_CYCLES
(100,000) templates.
- Add two tests to ensure recursion works somewhat correctly.
- Fix parsing the string "{{" with the Python tokenizer; add a test.
преди 11 години
Ben Kurtovic
f803269514
Add a USES_C field to the tokenizers; add TestParser.test_use_c()
преди 11 години
Ben Kurtovic
6a741db7ce
Applying fb71f5507e
преди 11 години
Ben Kurtovic
fb71f5507e
Support a 'use_c' field to explicitly disable the C tokenizer.
преди 11 години
Ben Kurtovic
054a84afe0
A bit of misc cleanup.
преди 11 години
Ben Kurtovic
718fcb24c8
Fix eight failing tests; all template parsing tests now passing ( #25 ).
преди 11 години
Ben Kurtovic
5a0a00ba98
Change the way verify_safe() handles template params ( #25 ).
- Newlines are now allowed in template param names.
- Changes also affect handling of arguments like {{{foo}}}.
- Update unit tests: remove some unnecessary ones, and add some to cover the changes.
- Update StringMixIn tests to actually work for some of the methods.
- Update copyright notices for the C extensions.
преди 11 години
Ben Kurtovic
0803417901
Port CTokenizer's verify_safe method to Python to solve a failing test.
преди 11 години
Ben Kurtovic
acb7e57904
Make mwparserfromhell.parser() be an alias for parse_anything().
Some other changes, including removal of the 'string' import in the tokenizer.
преди 11 години
Ben Kurtovic
d6f2723a06
Fix safety checks on template params in some odd cases ( closes #24 ).
Also, fix parsing of wikilinks in both tokenizers such that newlines
in any location within the title are an automatic failure.
преди 11 години
Ben Kurtovic
cd5cc6a7d0
Update copyright notices for 2013.
преди 11 години
Ben Kurtovic
11cf5def75
Fix handling of sections headers with equal signs ( closes #20 )
преди 11 години
Ben Kurtovic
dab6cc39ef
Fix handling of errors when parsing template param keys ( closes #13 )
преди 11 години
Ben Kurtovic
1f47e10f04
Start some Py3k compatibility stuff.
преди 11 години
Ben Kurtovic
ca11d77efd
Shorten some longer lines.
преди 11 години
Ben Kurtovic
4a725b7ac5
Fix another couple bugs regarding template contexts and verify_safe().
преди 11 години
Ben Kurtovic
1abdb478c9
Fix a couple bugs.
преди 11 години
Ben Kurtovic
88a2b95030
Remove a bunch of white space.
преди 11 години
Ben Kurtovic
3a6335d969
Clean up init_tokenizer().
преди 11 години
Ben Kurtovic
06f02b9753
Clean up whitespace / newlines.
преди 11 години
Ben Kurtovic
0e78571672
Forgot to check numeric/hexadecimal entities for string chars.
преди 11 години
Ben Kurtovic
a1e6dfcef6
Ensure that there is null terminator at the end of entitydefs.
преди 11 години
Ben Kurtovic
19e7c3b6ac
Fix type.
преди 11 години
Ben Kurtovic
06b20dd8c0
More updates.
преди 11 години
Ben Kurtovic
16024494cf
Mostly implement Tokenizer_really_parse_entity().
преди 11 години
Ben Kurtovic
087d606097
Recover failing contexts when due to a template or link opening.
преди 11 години
Ben Kurtovic
7de34ed5a6
Rewrite verify_safe completely.
преди 11 години
Ben Kurtovic
b2f933dddc
Fix memory leak.
преди 11 години
Ben Kurtovic
c5fea8ea34
Render the entire textbuffer correctly.
преди 11 години
Ben Kurtovic
cdef073a9b
Replace textbuffer with our own datastructure.
преди 11 години
Ben Kurtovic
f0a36f3262
Store tokens in a global variable instead of retrieving anew each time.
преди 11 години
Ben Kurtovic
6d73eeeab1
Replace Python list of stacks with a singly linked list.
преди 11 години
Ben Kurtovic
d2868731e8
Update some abstract protocols.
преди 11 години
Ben Kurtovic
1bfd364a4a
Process contexts in Tokenizer_handle_template_param() correctly.
преди 11 години
Ben Kurtovic
230c89711b
Fix verify_save and propogate errors correctly in the parse func.
преди 11 години
Ben Kurtovic
467aef3651
FromStringAndSize instead of FromString.
преди 11 години
Ben Kurtovic
29ef2a6682
Propogate fix from b447e7bfc1
преди 11 години
Ben Kurtovic
b447e7bfc1
contexts.WIKILINK should also fail
преди 11 години
Ben Kurtovic
ff0b4439f8
Replace Python exception machinery with a global and some macros.
преди 11 години
Ben Kurtovic
28a25d9a52
Bugfix when text ends within param key context.
преди 11 години
Ben Kurtovic
8e4819ea37
Fix exception implementation; some other cleanup and fixes.
преди 11 години
Ben Kurtovic
9993f1ba76
Fix object calls.
преди 11 години
Ben Kurtovic
0be18bc5b8
Fix Py_UNICODE comparisons.
преди 11 години
Ben Kurtovic
17a09e395a
Fix some bugs.
преди 11 години
Ben Kurtovic
c50de647e2
Implement Tokenizer_handle_heading_end() and malloc for HeadingData.
преди 11 години
Ben Kurtovic
48188bfa99
Implement Tokenizer_parse_heading(), some other stuff.
преди 11 години