use crate::tokens::{CommentKind, Keyword, NumberKind, Punct};
use crate::{is_line_term, OpenCurlyKind};
use unic_ucd_ident::{is_id_continue, is_id_start};
mod buffer;
mod tokens;
pub(super) use self::tokens::{RawToken, StringKind, TemplateKind};
use crate::error::RawError;
pub(crate)type Res<T> = Result<T, RawError>;

lazy_static! {
    static ref KEYWORDS: ::std::collections::HashMap<&'static [u8], Keyword> = {
        let mut k = ::std::collections::HashMap::new();
        k.insert("await".as_bytes(), Keyword::Await);
        k.insert("break".as_bytes(), Keyword::Break);
        k.insert("case".as_bytes(), Keyword::Case);
        k.insert("catch".as_bytes(), Keyword::Catch);
        k.insert("class".as_bytes(), Keyword::Class);
        k.insert("const".as_bytes(), Keyword::Const);
        k.insert("continue".as_bytes(), Keyword::Continue);
        k.insert("debugger".as_bytes(), Keyword::Debugger);
        k.insert("default".as_bytes(), Keyword::Default);
        k.insert("delete".as_bytes(), Keyword::Delete);
        k.insert("do".as_bytes(), Keyword::Do);
        k.insert("else".as_bytes(), Keyword::Else);
        k.insert("finally".as_bytes(), Keyword::Finally);
        k.insert("for".as_bytes(), Keyword::For);
        k.insert("function".as_bytes(), Keyword::Function);
        k.insert("if".as_bytes(), Keyword::If);
        k.insert("instanceof".as_bytes(), Keyword::InstanceOf);
        k.insert("in".as_bytes(), Keyword::In);
        k.insert("new".as_bytes(), Keyword::New);
        k.insert("return".as_bytes(), Keyword::Return);
        k.insert("switch".as_bytes(), Keyword::Switch);
        k.insert("this".as_bytes(), Keyword::This);
        k.insert("throw".as_bytes(), Keyword::Throw);
        k.insert("try".as_bytes(), Keyword::Try);
        k.insert("typeof".as_bytes(), Keyword::TypeOf);
        k.insert("var".as_bytes(), Keyword::Var);
        k.insert("void".as_bytes(), Keyword::Void);
        k.insert("while".as_bytes(), Keyword::While);
        k.insert("with".as_bytes(), Keyword::With);
        k.insert("export".as_bytes(), Keyword::Export);
        k.insert("import".as_bytes(), Keyword::Import);
        k.insert("super".as_bytes(), Keyword::Super);
        k.insert("enum".as_bytes(), Keyword::Enum);
        k.insert("implements".as_bytes(), Keyword::Implements);
        k.insert("interface".as_bytes(), Keyword::Interface);
        k.insert("package".as_bytes(), Keyword::Package);
        k.insert("private".as_bytes(), Keyword::Private);
        k.insert("protected".as_bytes(), Keyword::Protected);
        k.insert("public".as_bytes(), Keyword::Public);
        k.insert("static".as_bytes(), Keyword::Static);
        k.insert("yield".as_bytes(), Keyword::Yield);
        k.insert("let".as_bytes(), Keyword::Let);
        k
    };
}

pub struct RawItem {
    pub ty: tokens::RawToken,
    pub start: usize,
    pub end: usize,
}

pub struct Tokenizer<'a> {
    pub(super) stream: buffer::JSBuffer<'a>,
    pub(super) current_start: usize,
    pub(super) curly_stack: Vec<OpenCurlyKind>,
}

impl<'a> Tokenizer<'a> {
    pub fn new(stream: &'a str) -> Self {
        Tokenizer {
            current_start: 0,
            stream: stream.into(),
            curly_stack: Vec::new(),
        }
    }

    pub fn next(&mut self) -> Res<RawItem> {
        self.current_start = self.stream.idx;
        let next_char = match self.stream.next_char() {
            Some(ch) => ch,
            None => {
                return Ok(RawItem {
                    start: self.stream.idx,
                    end: self.stream.idx,
                    ty: RawToken::EoF,
                })
            }
        };
        if is_id_start(next_char) || next_char == '$' || next_char == '_' || next_char == '\\' {
            return self.ident(next_char);
        }
        if next_char == '"' || next_char == '\'' {
            return self.string(next_char);
        }
        if next_char == '(' || next_char == ')' || next_char == ';' {
            return self.punct(next_char);
        }
        if next_char.is_digit(10) {
            return self.number(next_char);
        }
        if next_char == '`' {
            return self.template(next_char);
        }
        if next_char == '}' && self.curly_stack.last() == Some(&OpenCurlyKind::Template) {
            self.curly_stack.pop();
            return self.template(next_char);
        }
        self.punct(next_char)
    }

    pub fn next_regex(&mut self) -> Res<RawItem> {
        self.current_start = self.stream.idx;
        let mut end_of_body = false;
        let mut body_idx = 0;
        if self.look_ahead_matches("\\/") {
            self.stream.skip(2);
        }
        let mut in_class = false;
        while let Some(c) = self.stream.next_char() {
            if end_of_body {
                if c == '\\' {
                    if self.look_ahead_matches("u{") {
                        self.stream.skip(2);
                        self.escaped_with_code_point()?;
                    } else if self.look_ahead_matches("u") {
                        self.stream.skip(1);
                        let start = self
                            .stream
                            .next_char()
                            .expect("unexpected end of file when parsing regex");
                        self.escaped_with_hex4(start)?;
                    }
                } else if !Self::is_id_continue(c) {
                    let _ = self.stream.prev_char();
                    return self.gen_regex(body_idx);
                }
            } else if c == '\\' {
                if self.stream.at_new_line() {
                    return Err(RawError {
                        idx: self.stream.idx,
                        msg: "new line in regex literal".to_string(),
                    });
                } else if self.look_ahead_matches("[")
                    || self.look_ahead_matches("/")
                    || self.look_ahead_matches("\\")
                {
                    self.stream.skip(1);
                }
            } else if is_line_term(c) {
                return Err(RawError {
                    idx: self.stream.idx,
                    msg: "new line in regex literal".to_string(),
                });
            } else if in_class {
                // we ignore the /
                if c == ']' {
                    in_class = false;
                }
            } else if c == '/' {
                end_of_body = true;
                body_idx = self.stream.idx;
            } else if c == '[' {
                in_class = true;
            }
        }
        if end_of_body {
            return self.gen_regex(body_idx);
        }
        Err(RawError {
            msg: format!("unterminated regex at {}", String::from_utf8_lossy(&self.stream.buffer[self.current_start..self.stream.idx])),
            idx: self.current_start,
        })
    }

    fn ident(&mut self, start: char) -> Res<RawItem> {
        if start == '\\' {
            // TODO validate escaped ident start
            self.escaped_ident_part()?;
        }
        while let Some(c) = self.stream.next_char() {
            if c == '\\' {
                self.escaped_ident_part()?;
            }
            if !Self::is_id_continue(c) && c != '$' && c != '\u{200C}' && c != '\u{200D}' {
                // if we have moved past the last valid identifier, go back 1
                let _ = self.stream.prev_char();
                break;
            }
        }
        if let Some(k) = self.at_keyword() {
            self.gen_token(RawToken::Keyword(k))
        } else if let Some(b) = self.at_bool() {
            self.gen_token(RawToken::Boolean(b))
        } else if &self.stream.buffer[self.current_start..self.stream.idx] == b"null" {
            self.gen_token(RawToken::Null)
        } else {
            self.gen_token(RawToken::Ident)
        }
    }

    fn at_keyword(&self) -> Option<Keyword> {
        KEYWORDS
            .get(&self.stream.buffer[self.current_start..self.stream.idx])
            .map(|k| *k)
    }

    fn at_bool(&self) -> Option<bool> {
        match &self.stream.buffer[self.current_start..self.stream.idx] {
            b"true" => Some(true),
            b"false" => Some(false),
            _ => None,
        }
    }
    /// picking up after the \
    fn escaped_ident_part(&mut self) -> Res<()> {
        if let Some('u') = self.stream.next_char() {
            if let Some(c) = self.stream.next_char() {
                if c == '{' {
                    self.escaped_with_code_point()?;
                } else {
                    self.escaped_with_hex4(c)?;
                }
            }
            Ok(())
        } else {
            Err(RawError {
                msg: "invalid unicode escape sequence in indentifier".to_string(),
                idx: self.current_start,
            })
        }
    }

    fn escaped_with_code_point(&mut self) -> Res<()> {
        let mut code: u32 = 0;
        let mut last_char: char = '{';
        while let Some(c) = self.stream.next_char() {
            last_char = c;
            if c == '}' {
                break;
            }
            if !c.is_digit(16) {
                return Err(RawError {
                    msg: "escaped unicode code point is not a hex digit".to_string(),
                    idx: self.stream.idx,
                });
            }

            code += match u32::from_str_radix(c.encode_utf8(&mut [0; 4]), 16) {
                Ok(n) => n,
                Err(e) => return Err(RawError {
                    msg: format!("escaped unicode code point could not be converted to a u32 with the error {}", e),
                    idx: self.stream.idx,
                })
            }
        }
        if code > 0x10FFF {
            Err(RawError {
                msg: "escaped unicode codepoint too large".to_string(),
                idx: self.stream.idx,
            })
        } else if last_char != '}' {
            Err(RawError {
                msg: "escaped unicode code points must end in }".to_string(),
                idx: self.current_start,
            })
        } else {
            Ok(())
        }
    }

    fn escaped_with_hex4(&mut self, start: char) -> Res<()> {
        assert!(start.is_digit(16));
        for _ in 0..3 {
            if let Some(c) = self.stream.next_char() {
                if !c.is_digit(16) {
                    return Err(RawError {
                        msg: "escaped unicode char code is not a hex digit".to_string(),
                        idx: self.stream.idx,
                    });
                }
            } else {
                return Err(RawError {
                    msg: "escaped unicode sequence does not have 4 characters".to_string(),
                    idx: self.current_start,
                });
            }
        }
        Ok(())
    }

    fn string(&mut self, quote: char) -> Res<RawItem> {
        let mut escaped = false;
        loop {
            if self.look_ahead_matches(r#"\"#) {
                if escaped {
                    escaped = false;
                } else {
                    escaped = true;
                }
                self.stream.skip(1)
            } else if self.look_ahead_matches("\r\n") {
                if !escaped {
                    return Err(RawError {
                        msg: "unescaped new line in string literal".to_string(),
                        idx: self.stream.idx
                    })
                } else {
                    self.stream.skip(2);
                    escaped = false;
                }
            } else if (self.look_ahead_matches("\n")
                || self.look_ahead_matches("\r")
                || self.look_ahead_matches("\u{2028}")
                || self.look_ahead_matches("\u{2029}"))
                && !escaped
            {
                return Err(RawError {
                    msg: "unescaped new line in string literal".to_string(),
                    idx: self.stream.idx
                });
            } else if self.stream.look_ahead_matches(&[quote as u8]) {
                self.stream.skip(1);
                if !escaped {
                    break;
                }
                escaped = false;
            } else {
                self.stream.skip(1);
                escaped = false;
            }
        }
        let inner = if quote == '"' {
            StringKind::Double
        } else {
            StringKind::Single
        };
        self.gen_token(RawToken::String(inner))
    }
    fn punct(&mut self, c: char) -> Res<RawItem> {
        match c {
            '(' => self.gen_punct(Punct::OpenParen),
            '{' => {
                self.curly_stack.push(OpenCurlyKind::Block);
                self.gen_punct(Punct::OpenBrace)
            }
            ')' => self.gen_punct(Punct::CloseParen),
            '}' => {
                let _ = self.curly_stack.pop();
                self.gen_punct(Punct::CloseBrace)
            }
            ';' => self.gen_punct(Punct::SemiColon),
            ',' => self.gen_punct(Punct::Comma),
            '[' => self.gen_punct(Punct::OpenBracket),
            ']' => self.gen_punct(Punct::CloseBracket),
            ':' => self.gen_punct(Punct::Colon),
            '?' => self.gen_punct(Punct::QuestionMark),
            '#' => self.gen_punct(Punct::Hash),
            '~' => self.gen_punct(Punct::Tilde),
            '.' => {
                // ...
                if self.look_ahead_matches("..") {
                    self.stream.skip(2);
                    self.gen_punct(Punct::Ellipsis)
                } else if self.stream.at_decimal() {
                    self.dec_number(true)
                } else {
                    self.gen_punct(Punct::Period)
                }
            }
            '>' => {
                if self.look_ahead_matches(">>=") {
                    self.stream.skip(3);
                    self.gen_punct(Punct::TripleGreaterThanEqual)
                } else if self.look_ahead_matches(">>") {
                    self.stream.skip(2);
                    self.gen_punct(Punct::TripleGreaterThan)
                } else if self.look_ahead_matches(">=") {
                    self.stream.skip(2);
                    self.gen_punct(Punct::DoubleGreaterThanEqual)
                } else if self.look_ahead_matches(">") {
                    self.stream.skip(1);
                    self.gen_punct(Punct::DoubleGreaterThan)
                } else if self.look_ahead_matches("=") {
                    self.stream.skip(1);
                    self.gen_punct(Punct::GreaterThanEqual)
                } else {
                    self.gen_punct(Punct::GreaterThan)
                }
            }
            '<' => {
                if self.look_ahead_matches("<=") {
                    self.stream.skip(2);
                    self.gen_punct(Punct::DoubleLessThanEqual)
                } else if self.look_ahead_matches("=") {
                    self.stream.skip(1);
                    self.gen_punct(Punct::LessThanEqual)
                } else if self.look_ahead_matches("<") {
                    self.stream.skip(1);
                    self.gen_punct(Punct::DoubleLessThan)
                } else if self.look_ahead_matches("!--") {
                    self.stream.skip(3);
                    self.html_comment()
                } else {
                    self.gen_punct(Punct::LessThan)
                }
            }
            '=' => {
                if self.look_ahead_matches("==") {
                    self.stream.skip(2);
                    self.gen_punct(Punct::TripleEqual)
                } else if self.look_ahead_matches("=") {
                    self.stream.skip(1);
                    self.gen_punct(Punct::DoubleEqual)
                } else if self.look_ahead_matches(">") {
                    self.stream.skip(1);
                    self.gen_punct(Punct::EqualGreaterThan)
                } else {
                    self.gen_punct(Punct::Equal)
                }
            }
            '!' => {
                if self.look_ahead_matches("==") {
                    self.stream.skip(2);
                    self.gen_punct(Punct::BangDoubleEqual)
                } else if self.look_ahead_matches("=") {
                    self.stream.skip(1);
                    self.gen_punct(Punct::BangEqual)
                } else {
                    self.gen_punct(Punct::Bang)
                }
            }
            '*' => {
                if self.look_ahead_matches("*=") {
                    self.stream.skip(2);
                    self.gen_punct(Punct::DoubleAsteriskEqual)
                } else if self.look_ahead_matches("*") {
                    self.stream.skip(1);
                    self.gen_punct(Punct::DoubleAsterisk)
                } else if self.look_ahead_matches("=") {
                    self.stream.skip(1);
                    self.gen_punct(Punct::AsteriskEqual)
                } else {
                    self.gen_punct(Punct::Asterisk)
                }
            }
            '&' => {
                if self.look_ahead_matches("&") {
                    self.stream.skip(1);
                    self.gen_punct(Punct::DoubleAmpersand)
                } else if self.look_ahead_matches("=") {
                    self.stream.skip(1);
                    self.gen_punct(Punct::AmpersandEqual)
                } else {
                    self.gen_punct(Punct::Ampersand)
                }
            }
            '|' => {
                if self.look_ahead_matches("|") {
                    self.stream.skip(1);
                    self.gen_punct(Punct::DoublePipe)
                } else if self.look_ahead_matches("=") {
                    self.stream.skip(1);
                    self.gen_punct(Punct::PipeEqual)
                } else {
                    self.gen_punct(Punct::Pipe)
                }
            }
            '+' => {
                if self.look_ahead_matches("+") {
                    self.stream.skip(1);
                    self.gen_punct(Punct::DoublePlus)
                } else if self.look_ahead_matches("=") {
                    self.stream.skip(1);
                    self.gen_punct(Punct::PlusEqual)
                } else {
                    self.gen_punct(Punct::Plus)
                }
            }
            '-' => {
                if self.look_ahead_matches("-") {
                    self.stream.skip(1);
                    self.gen_punct(Punct::DoubleDash)
                } else if self.look_ahead_matches("=") {
                    self.stream.skip(1);
                    self.gen_punct(Punct::DashEqual)
                } else {
                    self.gen_punct(Punct::Dash)
                }
            }
            '/' => {
                if self.look_ahead_matches("=") {
                    self.stream.skip(1);
                    self.gen_punct(Punct::ForwardSlashEqual)
                } else if self.look_ahead_matches("*") {
                    self.multi_comment()
                } else if self.look_ahead_matches("/") {
                    self.single_comment()
                } else {
                    self.gen_punct(Punct::ForwardSlash)
                }
            }
            '%' => {
                if self.look_ahead_matches("=") {
                    self.stream.skip(1);
                    self.gen_punct(Punct::PercentEqual)
                } else {
                    self.gen_punct(Punct::Percent)
                }
            }
            '^' => {
                if self.look_ahead_matches("=") {
                    self.stream.skip(1);
                    self.gen_punct(Punct::CaretEqual)
                } else {
                    self.gen_punct(Punct::Caret)
                }
            }
            _ => Err(RawError {
                msg: format!("unknown punct {:?}", c),
                idx: self.current_start,
            }),
        }
    }
    fn number(&mut self, start: char) -> Res<RawItem> {
        if start != '.' {
            if let Some(next) = self.stream.next_char() {
                if start == '0' {
                    if next == 'x' || next == 'X' {
                        self.hex_number()
                    } else if next == 'o' || next == 'O' {
                        self.oct_number()
                    } else if next == 'b' || next == 'B' {
                        self.bin_number()
                    } else if next.is_digit(10) || next == '.' {
                        self.dec_number(next == '.')
                    } else {
                        let _ = self.stream.prev_char();
                        self.dec_number(false)
                    }
                } else if next == '.' {
                    self.dec_number(true)
                } else {
                    let _ = self.stream.prev_char();
                    self.dec_number(next == '.')
                }
            } else {
                self.gen_number(NumberKind::Dec)
            }
        } else {
            self.punct(start)
        }
    }
    fn template(&mut self, start: char) -> Res<RawItem> {
        while let Some(c) = self.stream.next_char() {
            if c == '\\' {
                if self.look_ahead_matches("${") {
                    self.stream.skip(2);
                } else if self.look_ahead_matches("`") || self.look_ahead_matches("\\") {
                    self.stream.skip(1);
                } else if self.look_ahead_matches("0") {
                    if let Some(_zero) = self.stream.next_char() {
                        if self.stream.at_decimal() {
                            return Err(RawError {
                                msg: format!("Template contains invalid octal literal \\0{}", self.stream.next_char().unwrap_or('?')),
                                idx: self.stream.idx.saturating_sub(1),
                            });
                        } else {
                            let _ = self.stream.prev_char();
                        }
                    }
                } else if self.stream.at_octal() {
                    return Err(RawError {
                        msg: format!("Template contains invalid octal literal \\0{}", self.stream.next_char().unwrap_or('?')),
                        idx: self.stream.idx.saturating_sub(1),
                    });
                }
            } else if c == '$' {
                if self.look_ahead_matches("{") {
                    self.stream.skip(1);
                    self.curly_stack.push(OpenCurlyKind::Template);
                    if start == '`' {
                        return self.gen_template(TemplateKind::Head);
                    } else {
                        return self.gen_template(TemplateKind::Body);
                    }
                }
            } else if c == '`' {
                if start == '`' {
                    return self.gen_template(TemplateKind::NoSub);
                } else {
                    return self.gen_template(TemplateKind::Tail);
                }
            }
        }
        Err(RawError {
            msg: format!("unterminated template: {:?}", String::from_utf8_lossy(&self.stream.buffer[self.current_start..self.stream.idx])),
            idx: self.current_start,
        })
    }
    fn single_comment(&mut self) -> Res<RawItem> {
        while !self.at_new_line() {
            if self.stream.next_char().is_none() {
                break;
            }
        }
        self.gen_comment(CommentKind::Single)
    }
    fn multi_comment(&mut self) -> Res<RawItem> {
        if self.look_ahead_matches("*/") {
            self.stream.skip(2);
            return self.gen_comment(CommentKind::Multi);
        }
        while let Some(_) = self.stream.next_char() {
            if self.look_ahead_matches("*/") {
                self.stream.skip(2);
                return self.gen_comment(CommentKind::Multi);
            }
        }
        return Err(RawError {
            idx: self.current_start,
            msg: "unterminated multi-line comment".to_string(),
        });
    }
    fn html_comment(&mut self) -> Res<RawItem> {
        let mut found_end = false;
        while !self.at_new_line() && !self.stream.at_end() {
            if self.look_ahead_matches("-->") {
                found_end = true;
                self.stream.skip(3);
            } else {
                self.stream.skip(1);
            }
        }
        if found_end {
            return self.gen_token(RawToken::Comment(CommentKind::Html));
        }
        Err(RawError {
            msg: "unterminated html comment".to_string(),
            idx: self.current_start,
        })
    }
    fn hex_number(&mut self) -> Res<RawItem> {
        if let Some(c) = self.stream.next_char() {
            if !c.is_digit(16) {
                return Err(RawError {
                    msg: "empty hex literal".to_string(),
                    idx: self.current_start,
                });
            }
        } else {
            return Err(RawError {
                msg: "empty hex literal".to_string(),
                idx: self.current_start,
            });
        }
        while let Some(c) = self.stream.next_char() {
            if !c.is_digit(16) {
                let _ = self.stream.prev_char();
                break;
            }
        }
        self.gen_number(NumberKind::Hex)
    }
    fn oct_number(&mut self) -> Res<RawItem> {
        if let Some(c) = self.stream.next_char() {
            if !c.is_digit(8) {
                return Err(RawError {
                msg: "empty octal literal".to_string(),
                idx: self.current_start,
            });
            }
        } else {
            return Err(RawError {
                msg: "empty octal literal".to_string(),
                idx: self.current_start,
            });
        }
        while let Some(c) = self.stream.next_char() {
            if !c.is_digit(8) {
                let _ = self.stream.prev_char();
                break;
            }
        }
        self.gen_number(NumberKind::Oct)
    }
    fn bin_number(&mut self) -> Res<RawItem> {
        if let Some(c) = self.stream.next_char() {
            if !c.is_digit(2) {
                return Err(RawError {
                msg: "empty binary literal".to_string(),
                idx: self.current_start,
            });
            }
        } else {
            return Err(RawError {
                msg: "empty binary literal".to_string(),
                idx: self.current_start,
            });
        }
        while let Some(c) = self.stream.next_char() {
            if !c.is_digit(2) {
                let _ = self.stream.prev_char();
                break;
            }
        }
        self.gen_number(NumberKind::Bin)
    }
    fn dec_number(&mut self, seen_point: bool) -> Res<RawItem> {
        let mut maybe_e: Option<char> = None;

        if seen_point {
            while let Some(c) = self.stream.next_char() {
                if !c.is_digit(10) {
                    maybe_e = Some(c);
                    break;
                }
            }
        } else {
            while let Some(c) = self.stream.next_char() {
                if !c.is_digit(10) && c != '.' {
                    maybe_e = Some(c);
                    break;
                }
            }
        }
        if let Some(maybe_e) = maybe_e {
            if maybe_e != 'e' && maybe_e != 'E' {
                let _ = self.stream.prev_char();
            } else {
                if let Some(c) = self.stream.next_char() {
                    if c != '+' && c != '-' && !c.is_digit(10) {
                        return Err(RawError {
                            msg: "Invalid decimal, exponents must be followed by +, - or decimal digits".to_string(), 
                            idx: self.current_start
                        });
                    }
                }
                while let Some(c) = self.stream.next_char() {
                    if !c.is_digit(10) {
                        let _ = self.stream.prev_char();
                        break;
                    }
                }
            }
        }
        self.gen_number(NumberKind::Dec)
    }
    fn is_id_continue(c: char) -> bool {
        c == '$'
            || c == '_'
            || (c >= 'A' && c <= 'Z')
            || (c >= 'a' && c <= 'z')
            || c == '\\'
            || is_id_continue(c)
    }
    #[inline]
    fn look_ahead_matches(&self, s: &str) -> bool {
        self.stream.look_ahead_matches(s.as_bytes())
    }
    #[inline]
    fn gen_punct(&self, p: Punct) -> Res<RawItem> {
        self.gen_token(RawToken::Punct(p))
    }
    #[inline]
    fn gen_number(&self, n: NumberKind) -> Res<RawItem> {
        self.gen_token(RawToken::Number(n))
    }
    #[inline]
    fn gen_template(&self, t: TemplateKind) -> Res<RawItem> {
        self.gen_token(RawToken::Template(t))
    }
    #[inline]
    fn gen_regex(&self, body_idx: usize) -> Res<RawItem> {
        Ok(RawItem {
            start: self.current_start.saturating_sub(1),
            end: self.stream.idx,
            ty: RawToken::RegEx(body_idx),
        })
    }
    #[inline]
    fn gen_comment(&self, comment: CommentKind) -> Res<RawItem> {
        self.gen_token(RawToken::Comment(comment))
    }
    #[inline]
    fn gen_token(&self, ty: RawToken) -> Res<RawItem> {
        Ok(RawItem {
            start: self.current_start,
            end: self.stream.idx,
            ty,
        })
    }
    #[inline]
    pub fn skip_whitespace(&mut self) -> usize {
        let mut ct = 0;
        while self.stream.at_whitespace() {
            if self.stream.at_new_line() {
                ct += 1;
            }
            self.stream.skip(1);
        }
        ct
    }
    #[inline]
    fn at_new_line(&mut self) -> bool {
        self.stream.at_new_line()
    }
}

#[cfg(test)]
mod test {
    use super::*;
    #[test]
    fn tokenizer_punct() {
        static PUNCTS: &[&str] = &[
            "{", "}", "(", ")", ".", ";", ",", "[", "]", ":", "?", "~", ">", "<", "=", "!", "+",
            "-", "/", "*", "%", "&", "|", "^", ">>>=", //3 char
            "...", "===", "!==", ">>>", "<<=", ">>=", "**=", //2 char
            "&&", "||", "==", "!=", "+=", "-=", "*=", "/=", "++", "--", "<<", ">>", "&=", "|=",
            "^=", "%=", "<=", ">=", "=>", "**",
        ];
        for p in PUNCTS {
            let mut t = Tokenizer::new(p);
            let item = t.next().unwrap();
            println!("{:?}", item.ty);
            assert!(item.ty.is_punct());
            assert!(t.stream.at_end());
        }
    }
    #[test]
    fn tokenizer_strings() {
        static STRINGS: &[&str] = &[
            r#""things and stuff""#,
            r#"'people and places'"#,
            r#""with and escaped \"""#,
            r#"'another escaped \''"#,
            r#""with a new \
        line""#,
            r#"'another new line \
        hahaha'"#,
            "\"sequence double quoted\\\r\nis hard\"",
            "'new line sequence\\\r\nmight be harder'",
        ];
        for s in STRINGS {
            let mut t = Tokenizer::new(s);
            let item = t.next().unwrap();
            match &item.ty {
                RawToken::String(ref lit) => {
                    if &s[0..1] == "'" {
                        match lit {
                            StringKind::Single => (),
                            StringKind::Double => {
                                panic!("Expected single quote string, found double")
                            }
                        }
                    } else {
                        match lit {
                            StringKind::Single => {
                                panic!("expected double quote string, found single")
                            }
                            StringKind::Double => (),
                        }
                    }
                }
                _ => panic!("Expected string, found {:?}", item.ty),
            }
            assert_eq!(s.len(), item.end - item.start);
            assert!(t.stream.at_end());
        }
    }

    #[test]
    fn tokenizer_idents() {
        static IDENTS: &[&str] = &[
            r#"$"#,
            r#"_"#,
            r#"\u0078"#,
            r#"x$"#,
            r#"x_"#,
            r#"x\u0030"#,
            r#"xa"#,
            r#"x0"#,
            r#"x0a"#,
            r#"x0123456789"#,
            r#"qwertyuiopasdfghjklzxcvbnm"#,
            r#"QWERTYUIOPASDFGHJKLZXCVBNM"#,
            r#"œ一"#,
            r#"ǻ둘"#,
            r#"ɤ〩"#,
            r#"φ"#,
            r#"ﬁⅷ"#,
            r#"ユニコード"#,
            r#"x‌‍"#,
        ];
        for i in IDENTS {
            println!("attempting {}", i);
            let mut t = Tokenizer::new(i);
            let item = t.next().unwrap();
            assert_eq!(item.ty, RawToken::Ident);
            assert!(t.stream.at_end());
        }
    }

    #[test]
    fn tokenizer_number() {
        static NUMBERS: &[&str] = &[
            "0",
            "00",
            "1234567890",
            "01234567",
            "0.",
            "0.00",
            "10.00",
            ".0",
            "1.",
            "0e0",
            "0E0",
            "0.e0",
            "0.00e+0",
            ".00e-0",
            "0x0",
            "0X0",
            "0x0123456789abcdefABCDEF",
            "0b0",
            "0b0100101",
            "0o0",
            "0o777",
            "2e308",
            "1e1",
        ];
        for n in NUMBERS {
            println!("n: {}", n);
            let mut t = Tokenizer::new(n);
            let item = t.next().unwrap();
            assert!(match item.ty {
                RawToken::Number(_) => true,
                _ => false,
            });
            assert!(t.stream.at_end());
        }
    }

    #[test]
    fn tokenizer_regex() {
        static REGEX: &[&str] = &[
            r#"x/"#,
            r#"|/"#,
            r#"|||/"#,
            r#"^$\b\B/"#,
            r#"(?=(?!(?:(.))))/"#,
            r#"a.\f\n\r\t\v\0\[\-\/\\\x00\u0000/"#,
            r#"\d\D\s\S\w\W/"#,
            r#"\ca\cb\cc\cd\ce\cf\cg\ch\ci\cj\ck\cl\cm\cn\co\cp\cq\cr\cs\ct\cu\cv\cw\cx\cy\cz/"#,
            r#"\cA\cB\cC\cD\cE\cF\cG\cH\cI\cJ\cK\cL\cM\cN\cO\cP\cQ\cR\cS\cT\cU\cV\cW\cX\cY\cZ/"#,
            r#"[a-z-]/"#,
            r#"[^\b\-^]/"#,
            r#"[/\]\\]/"#,
            r#"./i"#,
            r#"./g"#,
            r#"./m"#,
            r#"./igm"#,
            r#".*/"#,
            r#".*?/"#,
            r#".+/"#,
            r#".+?/"#,
            r#".?/"#,
            r#".??/"#,
            r#".{0}/"#,
            r#".{0,}/"#,
            r#".{0,0}/"#,
        ];
        for r in REGEX {
            let mut t = Tokenizer::new(r);
            let item = t.next_regex().unwrap();
            assert!(match item.ty {
                RawToken::RegEx(_) => true,
                _ => false,
            });
            assert!(t.stream.at_end());
        }
    }

    #[test]
    fn tokenizer_template() {
        let subbed = "`things and stuff times ${} and animals and minerals`";
        println!("subbed: {}", subbed);
        let mut t = Tokenizer::new(subbed);
        let start = t.next().unwrap();
        assert_eq!(start.ty, RawToken::Template(TemplateKind::Head));
        let end = t.next().unwrap();
        assert_eq!(end.ty, RawToken::Template(TemplateKind::Tail));
        assert!(t.stream.at_end());
        let no_sub = "`things and stuff`";
        println!("no_sub {}", no_sub);
        t = Tokenizer::new(no_sub);
        let one = t.next().unwrap();
        assert_eq!(one.ty, RawToken::Template(TemplateKind::NoSub));
        assert!(t.stream.at_end());
        let escaped_sub = r#"`\0\n\x0A\u000A\u{A}${}`"#;
        println!("escaped_sub: {}", escaped_sub);
        t = Tokenizer::new(escaped_sub);
        let start = t.next().unwrap();
        assert_eq!(start.ty, RawToken::Template(TemplateKind::Head));
        let end = t.next().unwrap();
        assert_eq!(end.ty, RawToken::Template(TemplateKind::Tail));
        assert!(t.stream.at_end());
        let escaped_no_sub = r#"`a\${b`"#;
        println!("escaped_no_sub: {}", escaped_no_sub);
        t = Tokenizer::new(escaped_no_sub);
        let one = t.next().unwrap();
        assert_eq!(one.ty, RawToken::Template(TemplateKind::NoSub));
        assert!(t.stream.at_end());
        let double_sub =
            "`things and stuff times ${} and animals and minerals ${} and places and people`";
        println!("double_sub: {}", double_sub);
        t = Tokenizer::new(double_sub);
        let start = t.next().unwrap();
        assert_eq!(start.ty, RawToken::Template(TemplateKind::Head));
        let mid = t.next().unwrap();
        assert_eq!(mid.ty, RawToken::Template(TemplateKind::Body));
        let end = t.next().unwrap();
        assert_eq!(end.ty, RawToken::Template(TemplateKind::Tail));
        assert!(t.stream.at_end());
    }

    #[test]
    fn tokenizer_bools() {
        for b in &["true", "false"] {
            let mut t = Tokenizer::new(b);
            let item = t.next().unwrap();
            assert!(match item.ty {
                RawToken::Boolean(_) => true,
                _ => false,
            });
            assert!(t.stream.at_end());
        }
    }

    #[test]
    fn tokenizer_null() {
        let mut t = Tokenizer::new("null");
        let item = t.next().unwrap();
        assert_eq!(item.ty, RawToken::Null);
        assert!(t.stream.at_end());
    }

    #[test]
    fn tokenizer_keyword() {
        static KEYWORDS: &[&str] = &[
            "implements",
            "interface",
            "package",
            "private",
            "protected",
            "public",
            "static",
            "yield",
            "let",
            "enum",
            "export",
            "import",
            "super",
            "break",
            "case",
            "catch",
            "continue",
            "debugger",
            "default",
            "delete",
            "do",
            "else",
            "finally",
            "for",
            "function",
            "if",
            "instanceof",
            "in",
            "new",
            "return",
            "switch",
            "this",
            "throw",
            "try",
            "typeof",
            "var",
            "void",
            "while",
            "with",
        ];
        for k in KEYWORDS {
            let mut t = Tokenizer::new(k);
            let item = t.next().unwrap();
            assert!(match item.ty {
                RawToken::Keyword(_) => true,
                _ => false,
            });
            assert!(t.stream.at_end());
        }
    }

    #[test]
    fn tokenizer_comments() {
        static COMMENTS: &[&str] = &[
            "//this is a comment",
            "/*this is a
        multi-line comment*/",
            "<!-- This is an HTML comment -->",
            "<!-- This is an HTML comment --> with a trailer",
        ];
        for c in COMMENTS {
            let mut t = Tokenizer::new(c);
            let item = t.next().unwrap();
            assert!(item.ty.is_comment());
            assert!(t.stream.at_end());
        }
    }

    #[test]
    fn tokenizer_white_space() {
        let js = "0
0 0
0 0
0 0 0 0 0";
        let mut t = Tokenizer::new(js);
        let _ = t.next();
        assert_eq!(t.skip_whitespace(), 1); //\n
        let _ = t.next();
        assert_eq!(t.skip_whitespace(), 0);
        let _ = t.next();
        assert_eq!(t.skip_whitespace(), 1); //\r
        let _ = t.next();
        assert_eq!(t.skip_whitespace(), 0);
        let _ = t.next();
        assert_eq!(t.skip_whitespace(), 1); //\r\n
        let _ = t.next();
        assert_eq!(t.skip_whitespace(), 0);
        let _ = t.next();
        assert_eq!(t.skip_whitespace(), 1); // line seperator
        let _ = t.next();
        assert_eq!(t.skip_whitespace(), 0);
        let _ = t.next();
        assert_eq!(t.skip_whitespace(), 1); // paragraph separator
    }
}