48 Commits (v0.1)

Autor SHA1 Mensaje Fecha
  Ben Kurtovic 353122105d Fix tokenizer so we don't destroy our textbuf writing an empty stack hace 11 años
  Ben Kurtovic 814ce9f290 Fix an assumption regarding templates mistaken as arguments. hace 11 años
  Ben Kurtovic 70cf46ef0d Simplify / refactor. hace 11 años
  Ben Kurtovic 6b84a87c7d Far more robust parsing of templates and template arguments. hace 11 años
  Ben Kurtovic c01f78aee1 Implement arguments in tokenizer - preliminary results are promising. hace 11 años
  Ben Kurtovic b3bfe68cd8 Start Argument node type, implement argument in builder (#4). hace 11 años
  Ben Kurtovic a735efd0bc Template parameters containing newlines should be invalid (closes #6) hace 11 años
  Ben Kurtovic 816207bb5a Simplify docs massively. hace 11 años
  Ben Kurtovic bdf5608425 More documentation for various things. hace 11 años
  Ben Kurtovic 1caeb2d570 Build the actual Sphinx documentation, plus a number of typo fixes. hace 11 años
  Ben Kurtovic b2b49ebd80 More specific docs for contexts and tokenizer. hace 11 años
  Ben Kurtovic e787c97712 Finish documenting all of the main things (#5). hace 11 años
  Ben Kurtovic 975be475d3 Document Builder and contexts. hace 11 años
  Ben Kurtovic da3ad8ce9d Document Parser. hace 11 años
  Ben Kurtovic f21f13374e Fix py2 token support. hace 11 años
  Ben Kurtovic 391a5bd373 Compat for the parser itself. hace 11 años
  Riamse 2eb76e7de0 Adding Python 3 support hace 11 años
  Ben Kurtovic e57b6bdd93 Support Headings in tokenizer; handle tokens backwards in builder. hace 11 años
  Ben Kurtovic 40b6480aa7 Split on all characters that we use. hace 11 años
  Ben Kurtovic 664b6e39ec _write(text=True) -> _write_text(); __eq__ for Tokens hace 11 años
  Ben Kurtovic 278594a8cf Faster parsing: split the text on sentinels instead of every letter. hace 11 años
  Ben Kurtovic aec66b0db7 Missed another call (2.0 seconds -> 1.5 seconds for 1,000,000 chars). hace 11 años
  Ben Kurtovic 3fd13100da Another speedup by reducing calls to _read(). hace 11 años
  Ben Kurtovic 889fd316d3 A rogue print statement appears! hace 11 años
  Ben Kurtovic 31103b5891 _push_textbuffer() in _verify_template_name() hace 11 años
  Ben Kurtovic 2f4ce003b4 Massive speedup and refactoring. hace 11 años
  Ben Kurtovic 010bd34653 Support HTMLEntities. hace 11 años
  Ben Kurtovic 02fe3b0833 Improve handling of templates in strange cases. hace 11 años
  Ben Kurtovic e79c79762f Pre- and post-stop context verification, plus refactor parse_until(). hace 11 años
  Ben Kurtovic 8dd7b6aada Handle nested contexts correctly; parameter values; bad parse routes. hace 11 años
  Ben Kurtovic 6fefc28cba Handle integers as MediaWiki does. hace 11 años
  Ben Kurtovic 69b236ee8d Handle template parameter key dependents more intelligently. hace 11 años
  Ben Kurtovic 934b1ef016 Fixes and improvements. hace 11 años
  Ben Kurtovic d3ea962d27 Starting work on token contexts. hace 11 años
  Ben Kurtovic 2209dfc78d Better handling of template ends, refactor. hace 11 años
  Ben Kurtovic 32d99c3c75 Tokenizer now supports a very, very limited template syntax. hace 11 años
  Ben Kurtovic 17053e4701 Support &#Xhex; in addition to &#xhex;. hace 11 años
  Ben Kurtovic 81e5ce30af Working on the framework for the tokenizer, plus some cleanup, fixes. hace 11 años
  Ben Kurtovic 4539859c55 Merge BuildStack into Builder. hace 11 años
  Ben Kurtovic 8f0782f915 Fix some typos/bugs. hace 11 años
  Ben Kurtovic 219b9086d2 Finish implementing Builder for all existing Nodes; BuildStack. hace 11 años
  Ben Kurtovic 33acb3eea3 Starting main parser: Parser, Tokens, Tokenizer, Builder, BuildStack. hace 11 años
  Ben Kurtovic 3633f31633 Relaive imports because they are awesome; more stuff in SmartList. hace 11 años
  Ben Kurtovic 33f8924cf9 Implement Wikicode.get_sections(), starting SmartList. hace 12 años
  Ben Kurtovic 900c559385 Move mwpfh.parser.utils to mwpfh.utils; fix import structure. hace 12 años
  Ben Kurtovic e88a5fd3cc Quite a bit of additions, mostly to Template. hace 12 años
  Ben Kurtovic b77497e12a Fixes, plus don't inherit from unicode. hace 12 años
  Ben Kurtovic e4fd6ef127 Updating with a more logical project structure. hace 12 años