pub mod lexer;
pub mod iter;
use std::fmt;
use crate::lexer::*;
use crate::iter::MiniIter;

static COMMONMARK_SCHEME_ASCII: [char; 65] = [ //https://spec.commonmark.org/0.30/#scheme
    'A','B','C','D','E','F','G','H','I','J','K','L','M','N','O','P','Q','R','S','T','U','V','W','X','Y','Z',
    'a','b','c','d','e','f','g','h','i','j','k','l','m','n','o','p','q','r','s','t','u','v','w','x','y','z',
    '1','2','3','4','5','6','7','8','9','0',
    '+','.','-'];


#[derive(Debug)]
pub(crate) struct SanitizationError<'a>{
    pub(crate) content: &'a str,
}

#[derive(Debug, PartialEq, Eq)]
pub struct ValidURL<'a>{
    content: &'a str,
    scheme: Option<Scheme<'a>>,
}

impl <'a> ValidURL<'a>{
        fn fmt_unsafe(&self) -> String{
            let amp_replace_content = self.content.replace('&', "&amp;");
        match &self.scheme {
            None => {return format!("http:{}", amp_replace_content)},
            Some(Scheme::Email(_s)) => {return format!("{}", amp_replace_content)},
            Some(s) => {return format!("{}:{}", s, amp_replace_content)},
        }
    }
}


impl fmt::Display for ValidURL<'_>{
    fn fmt(&self, f: &mut fmt::Formatter) -> fmt::Result{
        match &self.scheme {
            None => {return write!(f, "http:{}", percent_encode(self.content).replace('&', "&amp;"))},
            Some(s) => {return write!(f, "{}:{}", s, percent_encode(self.content).replace('&', "&amp;"))},
        }
    }
}

#[derive(Debug, PartialEq, Eq)]
pub(crate) enum Scheme<'a>{
    Http(&'a str),
    Email(&'a str),
    Irc(&'a str),
    Other(&'a str),
}

impl fmt::Display for Scheme<'_> {
    fn fmt(&self, f: &mut fmt::Formatter) -> fmt::Result {
        match self {
            Scheme::Http(s) => {return write!(f, "{}", s)},
            Scheme::Email(s) => {return write!(f, "{}", s)},
            Scheme::Irc(s) => {return write!(f, "{}", s)},
            Scheme::Other(s) => {return write!(f, "{}", s)},
        }
    }
}

/// Convert source markdown to an ordered vector of tokens
pub fn lex<'a>(source: &'a str, ignore: &[char]) -> Vec<Token<'a>>{
    let mut char_iter = MiniIter::new(source);
    let mut tokens = Vec::new();
    while char_iter.peek().is_some(){
        match char_iter.peek().unwrap(){
            "#" if !ignore.contains(&'#') => {
                match lex_heading(&mut char_iter) {
                    Ok(t) => tokens.push(t),
                    Err(e) => push_str(&mut tokens, e.content),
                }
            },
            "*" | "_" => {
                match lex_asterisk_underscore(&mut char_iter) {
                    Ok(t) => tokens.push(t),
                    Err(e) => push_str(&mut tokens, e.content),
                }
            },
            "~" => {
                match lex_tilde(&mut char_iter) {
                    Ok(t) => tokens.push(t),
                    Err(e) => push_str(&mut tokens, e.content),
                }
            },
            "-" | "+" => {
                match lex_plus_minus(&mut char_iter) {
                    Ok(t) => tokens.push(t),
                    Err(e) => push_str(&mut tokens, e.content),
                }
            },
            " " | "\t" => {
                match lex_tabs_spaces(&mut char_iter, &tokens) {
                    Ok(t) => tokens.push(t),
                    Err(e) => push_str(&mut tokens, e.content),
                }
            },
            "`" => {
                match lex_backticks(&mut char_iter) {
                    Ok(t) => tokens.push(t),
                    Err(e) => push_str(&mut tokens, e.content),
                }
            },
            "\n" => {
                match lex_newlines(&mut char_iter, &tokens) {
                    Ok(t) => tokens.push(t),
                    Err(e) => push_str(&mut tokens, e.content),
                }
            },
            ">" => {
                match lex_blockquotes(&mut char_iter) {
                    Ok(t) => {
                        tokens.push(t);
                        },
                    Err(e) => push_str(&mut tokens, e.content),
                }
            },
            "!" => {
                match lex_images(&mut char_iter) {
                    Ok(t) => tokens.push(t),
                    Err(e) => push_str(&mut tokens, e.content),
                }
            },
            "[" => {
                match lex_links(&mut char_iter) {
                    Ok(t) => tokens.push(t),
                    Err(e) => push_str(&mut tokens, e.content),
                }
            },
            "<" => {
                match lex_side_carrot(&mut char_iter) {
                    Ok(t) => tokens.push(t),
                    Err(e) => push_str(&mut tokens, e.content),
                }
            },
            "|" => {
                match lex_pipes(&mut char_iter) {
                    Ok(t) => tokens.push(t),
                    Err(e) => push_str(&mut tokens, e.content),
                }
            },
            "1" | "2" | "3" | "4" | "5" | "6" | "7" | "8" | "9" | "0" => {
                match lex_numbers(&mut char_iter) {
                    Ok(t) => tokens.push(t),
                    Err(e) => push_str(&mut tokens, e.content),
                }
            }
            // Parse "\" to escape a markdown control character
            "\\" => {
                char_iter.next();
                if char_iter.peek() == Some(&"#"){
                    let hashes = char_iter.consume_while_case_holds(&|c| c == "#").unwrap_or("");
                    push_str(&mut tokens, hashes);
                } else if char_iter.peek().is_some(){
                    push_str(&mut tokens, char_iter.next().unwrap());
                }
            }
            _ => {
                push_str(&mut tokens, char_iter.next().unwrap());
            },
        }
    }
    tokens
}

/// Parse tokens to produce safe html output
pub fn parse(tokens: &[Token]) -> String {
    let mut html = String::with_capacity(tokens.len()*100);
    let mut in_task_list = false;
    let mut in_ordered_list = false;
    let mut in_unordered_list = false;
    let mut in_paragraph = false;
    let mut in_code = false;
    let mut quote_level = 0;
    let mut references = Vec::new();
    let mut token_iter = tokens.iter().peekable();

    while token_iter.peek().is_some(){
        let token = token_iter.next().unwrap();

        // Handle multi-liners
        match token {
            Token::Plaintext(t) if t.trim().is_empty() => {}, //Ignore empty plaintext tokens 
            Token::Tab | Token::DoubleTab => {},
            Token::OrderedListEntry(_) | Token::UnorderedListEntry(_) | Token::Newline if in_ordered_list | in_unordered_list => {},
            Token::TaskListItem(_, _)  | Token::Newline if in_task_list => {},
            _ if in_ordered_list => {
                in_ordered_list = false;
                html.push_str("</ol>\n");
                if !in_paragraph {
                    in_paragraph = true;
                    html.push_str("<p>") 
                }
            },
            _ if in_unordered_list => {
                in_unordered_list = false;
                html.push_str("</ul>\n");
                if !in_paragraph {
                    in_paragraph = true;
                    html.push_str("<p>") 
                }
            },
            _ if in_task_list => {
                in_task_list = false;
                html.push_str("</ul>\n");
                if !in_paragraph {
                    in_paragraph = true;
                    html.push_str("<p>") 
                }
            },
            Token::Code(_) if !in_code => {
                html.push_str("<pre><code>");
                in_code = true;
            },
            
            Token::BlockQuote(_, _) | Token::Newline if quote_level > 0 => {},
            Token::CodeBlock(_, _) | Token::Newline | Token::Header(_, _, _) if in_paragraph => {
                in_paragraph = false;
                html.push_str("</p>\n")
            },
            Token::Plaintext(_) | Token::Italic(_) | Token::Bold(_) | Token::BoldItalic(_) | Token::Strikethrough(_) | Token::Link(_, _, _) if !in_paragraph => {
                for _i in 0..quote_level {
                        html.push_str("</blockquote>");
                        quote_level-=1;
                }
                in_paragraph = true;
                html.push_str("<p>")
            },
            _ => {}
        }
        // Add content
        match token {
            Token::Plaintext(t) => {
                let mut t: String = t.to_string();
                if t.trim().is_empty() {continue}
                
                // Trim trailing whitespace after a \n
                match t.rfind('\n') {
                    None => {},
                    Some(n_index) => {
                        let (_before, after) = t.split_at(n_index);
                        if after.chars().all(|c| c.is_whitespace()) {
                            t = t.trim_end_matches(after).to_string();
                        } 
                    }
                }

                // Handle references
                if t.contains("[^") && t.contains("]") {
                    let plaintext_tokens = t.split("[^");
                    let mut s = String::new();
                    let mut count = 1;
                    for tok in plaintext_tokens {
                        if tok.trim_end().ends_with("]") {
                            let tok = tok.trim_end().trim_end_matches(']');
                            s.push_str(format!(
                                "<sup id=\"fnref:{reference}\" role=\"doc-noteref\"><a href=\"#fn:{reference}\" class=\"footnote\" rel=\"footnote\">{ref_count}</a></sup>", 
                                reference = sanitize_display_text(tok), 
                                ref_count = count).as_str());
                            count+=1;
                        } else {s.push_str(tok)}
                    }
                    html.push_str(&s);
                } else {
                    html.push_str(&sanitize_display_text(t.trim_start_matches('\n')))
                }
            },
            Token::Header(l, t, lbl) => {
                match lbl {
                    Some(lbl_text) => html.push_str(format!("<h{level} id=\"{id}\">{text}</h{level}>\n", 
                        level=l, 
                        text=t, 
                        id=sanitize_display_text(&lbl_text.replace(" ", "-")))
                        .as_str()),
                    None => html.push_str(format!("<h{level}>{text}</h{level}>\n", 
                        level=l, 
                        text=t)
                        .as_str()),
                };
            },
            Token::TaskListItem(c,t) => {
                if in_task_list == false {
                    in_task_list = true;
                    html.push_str("<ul class=\"contains-task-list\">")
                }
                match c {
                    TaskBox::Checked => {
                        html.push_str(format!("<li class=\"task-list-item\"><input type=\"checkbox\" class=\"task-list-item-checkbox\" checked=\"\">{}</li>", sanitize_display_text(t)).as_str())

                    },
                    TaskBox::Unchecked => {
                        html.push_str(format!("<li class=\"task-list-item\"><input type=\"checkbox\" class=\"task-list-item-checkbox\">{}</li>", sanitize_display_text(t)).as_str())
                    }
                }
            },
            Token::UnorderedListEntry(toks) => {
                if in_unordered_list == false {
                    in_unordered_list = true;
                    html.push_str("<ul>\n")
                }

                html.push_str(format!("<li>").as_str());
                if toks.into_iter().all(|t| matches!(t, Token::Plaintext(_))) {html.push_str(format!("\n").as_str());}
                for token in toks.iter() {
                    match token {
                        Token::Plaintext(text) if text.starts_with("\t\t") => {
                            html.push_str(&render(&text[1..].trim_start_matches(" ")).replace("<pre><code>", "<pre><code>  "));  
                        },
                        Token::Plaintext(text) => {
                            let text = &render(&text.trim_start_matches(" ")).replace("<pre><code>", "<pre><code>  ");
                            html.push_str(text);
                        },
                        _ => {},
                    }
                }
                html.push_str(format!("</li>\n").as_str());
            },
            Token::OrderedListEntry(t) => {
                if in_ordered_list == false {
                    in_ordered_list = true;
                    html.push_str(format!("<ol>\n").as_str())
                }
                html.push_str(format!("<li>\n{}</li>\n", sanitize_display_text(t)).as_str())
            },
            Token::Newline => {},
            Token::Tab => {html.push('\t')},
            Token::DoubleTab => {html.push_str("\t\t")},
            Token::Italic(t) => {html.push_str(format!("<em>{}</em>", sanitize_display_text(t)).as_str())},
            Token::Bold(t) => {html.push_str(format!("<strong>{}</strong>", sanitize_display_text(t)).as_str())},
            Token::BoldItalic(t) => {html.push_str(format!("<strong><em>{}</em></strong>", sanitize_display_text(t)).as_str())},
            Token::LineBreak => {html.push_str("<br>")},
            Token::HorizontalRule => {html.push_str("<hr />\n")},
            Token::Strikethrough(t) => {html.push_str(format!("<strike>{}</strike>", sanitize_display_text(t)).as_str())},
            Token::Code(t) => {
                html.push_str(format!("{}", sanitize_display_text(t)).as_str())},
            Token::CodeBlock(t, lang) => {
                html.push_str("<pre>");
                match lang.as_str() {
                    "" => html.push_str(format!("<code>{}</code>", sanitize_display_text(t)).as_str()),
                    _ => html.push_str(format!(
                        "<div class=\"language-{} highlighter-rouge\"><div class=\"highlight\"><pre class=\"highlight\"><code>{}</code></div></div>",
                        sanitize_display_text(lang), 
                        sanitize_display_text(t)
                        ).as_str()),
                };
                html.push_str("</pre>");
            },
            Token::BlockQuote(l, t) => {
                if in_paragraph {
                    html.push_str("</p>");
                    in_paragraph = false;
                }
                match quote_level {
                    _ if l == &quote_level => {},
                    _ if l < &quote_level => {
                        let diff = quote_level - l;
                        quote_level = *l;
                        for _i in 0..diff {
                            html.push_str("</blockquote>");
                        }
                    },
                    _ if l > &quote_level => {
                        let diff = l - quote_level;
                        quote_level = *l;
                        for _i in 0..diff {
                            html.push_str("<blockquote>\n");
                        }
                    },
                    _ => {},
                }
                if !t.is_empty(){
                    html.push_str(
                        &render(&sanitize_display_text(&t.trim_start_matches(" "))).replace("\t", "  ")
                        );
                }
            },
            Token::Image(l, t) => {
                match (l, t) {
                    (l, None) if l.trim() == "" => {html.push_str("<p><img src=\"data:,\"></p>")}
                    (l, Some(t)) if l.trim() == "" => {html.push_str(format!("<p><img src=\"data:,\" alt=\"{text}\"></p>", text=sanitize_display_text(t)).as_str())}
                    (l, None) => {html.push_str(format!("<p><img src=\"{link}\"> referrerpolicy=\"no-referrer\"></p>", link=l).as_str())}
                    (l, Some(t)) => {html.push_str(format!("<p><img src=\"{link}\" alt=\"{text}\" referrerpolicy=\"no-referrer\"></p>", link=l, text=sanitize_display_text(t)).as_str())}
                }
                
            },
            Token::Link(l, t, ht) => {
                match (t, ht){
                    (Some(t), Some(ht)) => html.push_str(format!("<a href=>\"{link}\" title=\"{hover}\">{text}</a>", link=l, text=sanitize_display_text(t), hover=ht).as_str()),
                    (Some(t), None) => html.push_str(format!("<a href=\"{link}\">{text}</a>", link=l, text=sanitize_display_text(t)).as_str()),
                    (None, Some(ht)) => html.push_str(format!("<a href=\"{link}\" title=\"{hover}\">{link}</a>", link=l, hover=sanitize_display_text(ht)).as_str()),
                    (None, None) => html.push_str(format!("<a href=\"{link}\">{display}</a>", link=l, display=l.fmt_unsafe()).as_str()),
                }
            },
            Token::Detail(summary, inner_tokens) => {
                if in_paragraph {
                    html.push_str("</p>\n");
                    in_paragraph = false;
                }
                let inner_html = parse(inner_tokens);
                html.push_str(format!("<details>\n<summary>{sum}</summary>\n{in_html}\n</details>", sum=sanitize_display_text(summary), in_html=inner_html).as_str());
            },
            Token::Table(headings, rows) => {
                if  headings.len() != rows[0].len() {continue}
                html.push_str("<table class=\"table table-bordered\">\n\t<thead>\n\t<tr>\n");
                for h in headings.into_iter() {
                    html.push_str(format!("\t\t<th style=\"text-align: {align}\">{heading}</th>", heading=sanitize_display_text(&h.1), align=h.0).as_str());
                }
                html.push_str("\t</tr>\n\t</thead>\n\t<tbody>");
                for row in rows.iter(){
                    html.push_str("\n\t<tr>");
                    for elem in row.iter(){
                        let mut row_string = String::new();
                        for token in elem.1.iter() {
                           match token {
                            Token::Plaintext(s) => row_string.push_str(&sanitize_display_text(&s)),
                            Token::Italic(t) => {row_string.push_str(format!("<em>{}</em>", sanitize_display_text(t)).as_str())},
                            Token::Bold(t) => {row_string.push_str(format!("<strong>{}</strong>", sanitize_display_text(t)).as_str())},
                            Token::BoldItalic(t) => {row_string.push_str(format!("<strong><em>{}</em></strong>", sanitize_display_text(t)).as_str())},
                            Token::LineBreak => {row_string.push_str("<br>")},
                            Token::HorizontalRule => {row_string.push_str("<hr />")},
                            Token::Strikethrough(t) => {row_string.push_str(format!("<strike>{}</strike>", sanitize_display_text(t)).as_str())},
                            _ => row_string.push_str(&parse(&elem.1))
                            } 
                        }
                        html.push_str(format!("\n\t\t<td style=\"text-align: {align}\">{row_text}</td>", align=elem.0, row_text=row_string).as_str());
                    }
                    html.push_str("\n\t</tr>");
                }
                html.push_str("\n\t</tbody>\n</table>");
            },
            Token::Footnote(ref_id, text) => {
                references.push((ref_id, text));
            },
        }
    }

    // Close out any open tags
    if in_paragraph {
        html.push_str("</p>\n");
    }
    if in_task_list | in_unordered_list {
        html.push_str("</ul>");
    }
    if in_ordered_list {
        html.push_str("</ol>");
    }
    if quote_level > 0 {
        for _i in (0..quote_level).rev(){
            html.push_str("</blockquote>\n");
        }
    }
    if in_code && !matches!(token_iter.peek(), Some(Token::Code(_))) {
        match html.chars().last().unwrap() {
            '\n' => {},
            _ => {html.push('\n')},
        }
        html.push_str("</code></pre>");
    }

    // Add references
    if references.len() > 0{
        html.push_str("<div class=\"footnotes\" role=\"doc-endnotes\">\n");
        html.push_str("\t<ol>\n");
        for reference in references.iter(){
            html.push_str("\t\t<li id=\"fn:1\" role=\"doc-endnote\">");
            html.push_str(format!("\t\t\t<p>{ref_text}<a href=\"#fnref:{ref_count}\" class=\"reversefootnote\" role=\"doc-backlink\">↩</a></p>", 
                ref_count=sanitize_display_text(reference.0), 
                ref_text=sanitize_display_text(reference.1)).as_str());
            html.push_str("\t\t</li>");
        }
        html.push_str("\t</ol>\n");
        html.push_str("</div>\n");
    }
    if html.chars().last().unwrap_or(' ') != '\n' {
        html.push('\n');
    }
    html
}

/// Render HTML from a source markdown string
/// Output is sanitized to prevent script injection
pub fn render(source: &str) -> String {
    parse(&lex(source, &[]))
}

pub(crate) fn render_ignore(source: &str, ignore: &[char]) -> String {
    parse(&lex(source, ignore))
}

/// Replace potentially unsafe characters with html entities
pub(crate) fn sanitize_display_text(source: &str) -> String {
    source.replace('&', "&amp;")
        .replace('<', "&lt;")
        .replace('>', "&gt;")
        .replace('"', "&quot;")
        .replace('\'', "&apos;")
        .replace('[', "&lbrack;")
        .replace(']', "&rbrack;")
        .replace('{', "&lbrace;")
        .replace('}', "&rbrace;")
        .replace('|', "&mid;")
        .replace('\\', "")
        .replace('~', "&tilde;")
        .replace(')', "&#41;")
        .replace('(', "&#40;")
}

pub(crate) fn percent_encode(source: &str) -> String {
    source.replace('%', "%25")
        .replace('#',"%23")
        .replace('[',"%5B")
        .replace(']',"%5D")
        .replace('!',"%21")
        .replace('$',"%24")
        .replace("'","%27")
        .replace('(',"%28")
        .replace(')',"%29")
        .replace('*',"%2A")
        .replace(' ',"%20")
        .replace('\\', "%5C")
}

pub(crate) fn validate_link(source: &str) -> Result<ValidURL, SanitizationError> {
    if !source.is_ascii() || source.contains(char::is_whitespace) { // https://www.rfc-editor.org/rfc/rfc3986#section-2
        return Err(SanitizationError{content: source})
    }
    let (scheme, path) = source.split_at(source.find(':').unwrap_or(0));
    if scheme.to_lowercase() == "javascript" || !scheme.is_ascii() {
        return Err(SanitizationError{content: source})
    }
    if scheme.to_lowercase() == "data" && !path.starts_with(":image/"){
        return Err(SanitizationError{content: source})
    }
    if scheme.len() != 0 && ( scheme.len() < 2 || scheme.len() > 32 ) {
        return Err(SanitizationError{content: source})
    }

    // Scheme defined here https://spec.commonmark.org/0.30/#scheme
    // char set in COMMONMARK_SCHEME_ASCII. 2 to 32 chars followed by `:`
    let source_scheme = {
        let parts: Vec<_> = source.split(":").collect();
        if source.contains(':')
            && parts[0].chars().all(|c| COMMONMARK_SCHEME_ASCII.contains(&c))
            && parts[0].len() >= 2
            && parts[0].len() <= 32 {
                match parts[0] {
                    "http" => Some(Scheme::Http(parts[0])),
                    "mailto" => Some(Scheme::Email(parts[0])),
                    "irc" => Some(Scheme::Irc(parts[0])),
                    _ => Some(Scheme::Other(parts[0]))
                }
            } else {None}
    };

    //Check for mail links
    if source.contains('@') && source.matches('@').count() == 1 && !source.contains('\\') {
        if source_scheme.is_some() {
            return Ok(ValidURL{scheme: Some(source_scheme.unwrap_or(Scheme::Email("mailto"))), content: &source.split(":").last().unwrap()})   
        }
        return Ok(ValidURL{scheme: Some(source_scheme.unwrap_or(Scheme::Email("mailto"))), content: &source})
    }
    if source.contains('@') && source.matches('@').count() == 1 && source.contains('\\') {
        return Err(SanitizationError{content: source})
    }

    match source_scheme {
        Some(Scheme::Http(s)) => {Ok(ValidURL{content: source.strip_prefix(s).unwrap_or("").strip_prefix(":").unwrap_or(""), scheme: Some(Scheme::Http(s))})},
        Some(Scheme::Email(s)) => {Ok(ValidURL{content: source.strip_prefix(s).unwrap_or("").strip_prefix(":").unwrap_or(""), scheme: Some(Scheme::Email(s))})},
        Some(Scheme::Irc(s)) => {Ok(ValidURL{content: source.strip_prefix(s).unwrap_or("").strip_prefix(":").unwrap_or(""), scheme: Some(Scheme::Irc(s))})},
        Some(Scheme::Other(s)) => Ok(ValidURL{content: source.strip_prefix(s).unwrap_or("").strip_prefix(":").unwrap_or(""), scheme: Some(Scheme::Other(s))}),
        None => Ok(ValidURL{content: source, scheme: None}),
    }
    
}