]> source.dussan.org Git - gitea.git/commitdiff
Add option to disable ambiguous unicode characters detection (#28454)
authorwxiaoguang <wxiaoguang@gmail.com>
Sun, 17 Dec 2023 14:38:54 +0000 (22:38 +0800)
committerGitHub <noreply@github.com>
Sun, 17 Dec 2023 14:38:54 +0000 (14:38 +0000)
* Close #24483
* Close #28123
* Close #23682
* Close #23149

(maybe more)

17 files changed:
custom/conf/app.example.ini
docs/content/administration/config-cheat-sheet.en-us.md
modules/charset/escape.go
modules/charset/escape_stream.go
modules/charset/escape_test.go
modules/git/command.go
modules/highlight/highlight.go
modules/highlight/highlight_test.go
modules/indexer/code/search.go
modules/markup/orgmode/orgmode.go
modules/setting/ui.go
modules/util/string.go
routers/web/repo/blame.go
routers/web/repo/view.go
services/gitdiff/gitdiff.go
services/gitdiff/highlightdiff.go
templates/repo/view_file.tmpl

index e10c4f7582e91b25281bffee459c6b8a1d8c62d6..9a5d19074595f098b1ef6dc522900c2b5e301aef 100644 (file)
@@ -1212,6 +1212,9 @@ LEVEL = Info
 ;; Max size of files to be displayed (default is 8MiB)
 ;MAX_DISPLAY_FILE_SIZE = 8388608
 ;;
+;; Detect ambiguous unicode characters in file contents and show warnings on the UI
+;AMBIGUOUS_UNICODE_DETECTION = true
+;;
 ;; Whether the email of the user should be shown in the Explore Users page
 ;SHOW_USER_EMAIL = true
 ;;
index 1fa8dacb67e252e4407893759b1c68230e2f0a2b..9810dab49bc1562ae11de3b00fce880b6c511fce 100644 (file)
@@ -220,6 +220,7 @@ The following configuration set `Content-Type: application/vnd.android.package-a
 - `THEMES`:  **gitea-auto,gitea-light,gitea-dark**: All available themes. Allow users select personalized themes.
   regardless of the value of `DEFAULT_THEME`.
 - `MAX_DISPLAY_FILE_SIZE`: **8388608**: Max size of files to be displayed (default is 8MiB)
+- `AMBIGUOUS_UNICODE_DETECTION`: **true**: Detect ambiguous unicode characters in file contents and show warnings on the UI
 - `REACTIONS`: All available reactions users can choose on issues/prs and comments
     Values can be emoji alias (:smile:) or a unicode emoji.
     For custom reactions, add a tightly cropped square image to public/assets/img/emoji/reaction_name.png
index 5608836a4510e0eb7c85bbdad0d0ff8a61b6db0c..92e417d1f72836a6af94954db358d82e9a6df6bf 100644 (file)
@@ -8,11 +8,12 @@
 package charset
 
 import (
-       "bufio"
+       "html/template"
        "io"
        "strings"
 
        "code.gitea.io/gitea/modules/log"
+       "code.gitea.io/gitea/modules/setting"
        "code.gitea.io/gitea/modules/translation"
 )
 
@@ -20,20 +21,18 @@ import (
 const RuneNBSP = 0xa0
 
 // EscapeControlHTML escapes the unicode control sequences in a provided html document
-func EscapeControlHTML(text string, locale translation.Locale, allowed ...rune) (escaped *EscapeStatus, output string) {
+func EscapeControlHTML(html template.HTML, locale translation.Locale, allowed ...rune) (escaped *EscapeStatus, output template.HTML) {
        sb := &strings.Builder{}
-       outputStream := &HTMLStreamerWriter{Writer: sb}
-       streamer := NewEscapeStreamer(locale, outputStream, allowed...).(*escapeStreamer)
-
-       if err := StreamHTML(strings.NewReader(text), streamer); err != nil {
-               streamer.escaped.HasError = true
-               log.Error("Error whilst escaping: %v", err)
-       }
-       return streamer.escaped, sb.String()
+       escaped, _ = EscapeControlReader(strings.NewReader(string(html)), sb, locale, allowed...) // err has been handled in EscapeControlReader
+       return escaped, template.HTML(sb.String())
 }
 
-// EscapeControlReaders escapes the unicode control sequences in a provided reader of HTML content and writer in a locale and returns the findings as an EscapeStatus and the escaped []byte
+// EscapeControlReader escapes the unicode control sequences in a provided reader of HTML content and writer in a locale and returns the findings as an EscapeStatus
 func EscapeControlReader(reader io.Reader, writer io.Writer, locale translation.Locale, allowed ...rune) (escaped *EscapeStatus, err error) {
+       if !setting.UI.AmbiguousUnicodeDetection {
+               _, err = io.Copy(writer, reader)
+               return &EscapeStatus{}, err
+       }
        outputStream := &HTMLStreamerWriter{Writer: writer}
        streamer := NewEscapeStreamer(locale, outputStream, allowed...).(*escapeStreamer)
 
@@ -43,41 +42,3 @@ func EscapeControlReader(reader io.Reader, writer io.Writer, locale translation.
        }
        return streamer.escaped, err
 }
-
-// EscapeControlStringReader escapes the unicode control sequences in a provided reader of string content and writer in a locale and returns the findings as an EscapeStatus and the escaped []byte. HTML line breaks are not inserted after every newline by this method.
-func EscapeControlStringReader(reader io.Reader, writer io.Writer, locale translation.Locale, allowed ...rune) (escaped *EscapeStatus, err error) {
-       bufRd := bufio.NewReader(reader)
-       outputStream := &HTMLStreamerWriter{Writer: writer}
-       streamer := NewEscapeStreamer(locale, outputStream, allowed...).(*escapeStreamer)
-
-       for {
-               line, rdErr := bufRd.ReadString('\n')
-               if len(line) > 0 {
-                       if err := streamer.Text(line); err != nil {
-                               streamer.escaped.HasError = true
-                               log.Error("Error whilst escaping: %v", err)
-                               return streamer.escaped, err
-                       }
-               }
-               if rdErr != nil {
-                       if rdErr != io.EOF {
-                               err = rdErr
-                       }
-                       break
-               }
-       }
-       return streamer.escaped, err
-}
-
-// EscapeControlString escapes the unicode control sequences in a provided string and returns the findings as an EscapeStatus and the escaped string
-func EscapeControlString(text string, locale translation.Locale, allowed ...rune) (escaped *EscapeStatus, output string) {
-       sb := &strings.Builder{}
-       outputStream := &HTMLStreamerWriter{Writer: sb}
-       streamer := NewEscapeStreamer(locale, outputStream, allowed...).(*escapeStreamer)
-
-       if err := streamer.Text(text); err != nil {
-               streamer.escaped.HasError = true
-               log.Error("Error whilst escaping: %v", err)
-       }
-       return streamer.escaped, sb.String()
-}
index 03d4cfc0c17bc8b673a30557ed802afc096976df..3f08fd94a497ffca0541e3050cc7b152835f7475 100644 (file)
@@ -64,7 +64,7 @@ func (e *escapeStreamer) Text(data string) error {
                        until, next = nextIdxs[0]+pos, nextIdxs[1]+pos
                }
 
-               // from pos until until we know that the runes are not \r\t\n or even ' '
+               // from pos until we know that the runes are not \r\t\n or even ' '
                runes := make([]rune, 0, next-until)
                positions := make([]int, 0, next-until+1)
 
index f63c5c5c52b321097d7e4ad49f82ca7d023967b3..a353ced63169f236d1b71829b05d73639ce98d7e 100644 (file)
@@ -4,11 +4,14 @@
 package charset
 
 import (
-       "reflect"
        "strings"
        "testing"
 
+       "code.gitea.io/gitea/modules/setting"
+       "code.gitea.io/gitea/modules/test"
        "code.gitea.io/gitea/modules/translation"
+
+       "github.com/stretchr/testify/assert"
 )
 
 type escapeControlTest struct {
@@ -132,22 +135,8 @@ then resh (ר), and finally heh (ה) (which should appear leftmost).`,
        },
 }
 
-func TestEscapeControlString(t *testing.T) {
-       for _, tt := range escapeControlTests {
-               t.Run(tt.name, func(t *testing.T) {
-                       status, result := EscapeControlString(tt.text, &translation.MockLocale{})
-                       if !reflect.DeepEqual(*status, tt.status) {
-                               t.Errorf("EscapeControlString() status = %v, wanted= %v", status, tt.status)
-                       }
-                       if result != tt.result {
-                               t.Errorf("EscapeControlString()\nresult= %v,\nwanted= %v", result, tt.result)
-                       }
-               })
-       }
-}
-
 func TestEscapeControlReader(t *testing.T) {
-       // lets add some control characters to the tests
+       // add some control characters to the tests
        tests := make([]escapeControlTest, 0, len(escapeControlTests)*3)
        copy(tests, escapeControlTests)
 
@@ -169,29 +158,20 @@ func TestEscapeControlReader(t *testing.T) {
 
        for _, tt := range tests {
                t.Run(tt.name, func(t *testing.T) {
-                       input := strings.NewReader(tt.text)
                        output := &strings.Builder{}
-                       status, err := EscapeControlReader(input, output, &translation.MockLocale{})
-                       result := output.String()
-                       if err != nil {
-                               t.Errorf("EscapeControlReader(): err = %v", err)
-                       }
-
-                       if !reflect.DeepEqual(*status, tt.status) {
-                               t.Errorf("EscapeControlReader() status = %v, wanted= %v", status, tt.status)
-                       }
-                       if result != tt.result {
-                               t.Errorf("EscapeControlReader()\nresult= %v,\nwanted= %v", result, tt.result)
-                       }
+                       status, err := EscapeControlReader(strings.NewReader(tt.text), output, &translation.MockLocale{})
+                       assert.NoError(t, err)
+                       assert.Equal(t, tt.status, *status)
+                       assert.Equal(t, tt.result, output.String())
                })
        }
 }
 
-func TestEscapeControlReader_panic(t *testing.T) {
-       bs := make([]byte, 0, 20479)
-       bs = append(bs, 'A')
-       for i := 0; i < 6826; i++ {
-               bs = append(bs, []byte("—")...)
-       }
-       _, _ = EscapeControlString(string(bs), &translation.MockLocale{})
+func TestSettingAmbiguousUnicodeDetection(t *testing.T) {
+       defer test.MockVariableValue(&setting.UI.AmbiguousUnicodeDetection, true)()
+       _, out := EscapeControlHTML("a test", &translation.MockLocale{})
+       assert.EqualValues(t, `a<span class="escaped-code-point" data-escaped="[U+00A0]"><span class="char"> </span></span>test`, out)
+       setting.UI.AmbiguousUnicodeDetection = false
+       _, out = EscapeControlHTML("a test", &translation.MockLocale{})
+       assert.EqualValues(t, `a test`, out)
 }
index f095bb18bef75f72b87bdf0beeb3c17e9b641ca2..9305ef6f928e7be1c844c0de9cc7570a40f7f439 100644 (file)
@@ -14,7 +14,6 @@ import (
        "os/exec"
        "strings"
        "time"
-       "unsafe"
 
        "code.gitea.io/gitea/modules/git/internal" //nolint:depguard // only this file can use the internal type CmdArg, other files and packages should use AddXxx functions
        "code.gitea.io/gitea/modules/log"
@@ -389,15 +388,11 @@ func (r *runStdError) IsExitCode(code int) bool {
        return false
 }
 
-func bytesToString(b []byte) string {
-       return *(*string)(unsafe.Pointer(&b)) // that's what Golang's strings.Builder.String() does (go/src/strings/builder.go)
-}
-
 // RunStdString runs the command with options and returns stdout/stderr as string. and store stderr to returned error (err combined with stderr).
 func (c *Command) RunStdString(opts *RunOpts) (stdout, stderr string, runErr RunStdError) {
        stdoutBytes, stderrBytes, err := c.RunStdBytes(opts)
-       stdout = bytesToString(stdoutBytes)
-       stderr = bytesToString(stderrBytes)
+       stdout = util.UnsafeBytesToString(stdoutBytes)
+       stderr = util.UnsafeBytesToString(stderrBytes)
        if err != nil {
                return stdout, stderr, &runStdError{err: err, stderr: stderr}
        }
@@ -432,7 +427,7 @@ func (c *Command) RunStdBytes(opts *RunOpts) (stdout, stderr []byte, runErr RunS
        err := c.Run(newOpts)
        stderr = stderrBuf.Bytes()
        if err != nil {
-               return nil, stderr, &runStdError{err: err, stderr: bytesToString(stderr)}
+               return nil, stderr, &runStdError{err: err, stderr: util.UnsafeBytesToString(stderr)}
        }
        // even if there is no err, there could still be some stderr output
        return stdoutBuf.Bytes(), stderr, nil
index a67217e864675c502773aaaf2219865f78dc1226..d7ab3f7afd3e778674430240a25aaab46812d883 100644 (file)
@@ -9,6 +9,7 @@ import (
        "bytes"
        "fmt"
        gohtml "html"
+       "html/template"
        "io"
        "path/filepath"
        "strings"
@@ -55,7 +56,7 @@ func NewContext() {
 }
 
 // Code returns a HTML version of code string with chroma syntax highlighting classes and the matched lexer name
-func Code(fileName, language, code string) (string, string) {
+func Code(fileName, language, code string) (output template.HTML, lexerName string) {
        NewContext()
 
        // diff view newline will be passed as empty, change to literal '\n' so it can be copied
@@ -65,7 +66,7 @@ func Code(fileName, language, code string) (string, string) {
        }
 
        if len(code) > sizeLimit {
-               return code, ""
+               return template.HTML(template.HTMLEscapeString(code)), ""
        }
 
        var lexer chroma.Lexer
@@ -102,13 +103,11 @@ func Code(fileName, language, code string) (string, string) {
                cache.Add(fileName, lexer)
        }
 
-       lexerName := formatLexerName(lexer.Config().Name)
-
-       return CodeFromLexer(lexer, code), lexerName
+       return CodeFromLexer(lexer, code), formatLexerName(lexer.Config().Name)
 }
 
 // CodeFromLexer returns a HTML version of code string with chroma syntax highlighting classes
-func CodeFromLexer(lexer chroma.Lexer, code string) string {
+func CodeFromLexer(lexer chroma.Lexer, code string) template.HTML {
        formatter := html.New(html.WithClasses(true),
                html.WithLineNumbers(false),
                html.PreventSurroundingPre(true),
@@ -120,23 +119,23 @@ func CodeFromLexer(lexer chroma.Lexer, code string) string {
        iterator, err := lexer.Tokenise(nil, code)
        if err != nil {
                log.Error("Can't tokenize code: %v", err)
-               return code
+               return template.HTML(template.HTMLEscapeString(code))
        }
        // style not used for live site but need to pass something
        err = formatter.Format(htmlw, githubStyles, iterator)
        if err != nil {
                log.Error("Can't format code: %v", err)
-               return code
+               return template.HTML(template.HTMLEscapeString(code))
        }
 
        _ = htmlw.Flush()
        // Chroma will add newlines for certain lexers in order to highlight them properly
        // Once highlighted, strip them here, so they don't cause copy/paste trouble in HTML output
-       return strings.TrimSuffix(htmlbuf.String(), "\n")
+       return template.HTML(strings.TrimSuffix(htmlbuf.String(), "\n"))
 }
 
 // File returns a slice of chroma syntax highlighted HTML lines of code and the matched lexer name
-func File(fileName, language string, code []byte) ([]string, string, error) {
+func File(fileName, language string, code []byte) ([]template.HTML, string, error) {
        NewContext()
 
        if len(code) > sizeLimit {
@@ -183,14 +182,14 @@ func File(fileName, language string, code []byte) ([]string, string, error) {
        tokensLines := chroma.SplitTokensIntoLines(iterator.Tokens())
        htmlBuf := &bytes.Buffer{}
 
-       lines := make([]string, 0, len(tokensLines))
+       lines := make([]template.HTML, 0, len(tokensLines))
        for _, tokens := range tokensLines {
                iterator = chroma.Literator(tokens...)
                err = formatter.Format(htmlBuf, githubStyles, iterator)
                if err != nil {
                        return nil, "", fmt.Errorf("can't format code: %w", err)
                }
-               lines = append(lines, htmlBuf.String())
+               lines = append(lines, template.HTML(htmlBuf.String()))
                htmlBuf.Reset()
        }
 
@@ -198,9 +197,9 @@ func File(fileName, language string, code []byte) ([]string, string, error) {
 }
 
 // PlainText returns non-highlighted HTML for code
-func PlainText(code []byte) []string {
+func PlainText(code []byte) []template.HTML {
        r := bufio.NewReader(bytes.NewReader(code))
-       m := make([]string, 0, bytes.Count(code, []byte{'\n'})+1)
+       m := make([]template.HTML, 0, bytes.Count(code, []byte{'\n'})+1)
        for {
                content, err := r.ReadString('\n')
                if err != nil && err != io.EOF {
@@ -210,7 +209,7 @@ func PlainText(code []byte) []string {
                if content == "" && err == io.EOF {
                        break
                }
-               s := gohtml.EscapeString(content)
+               s := template.HTML(gohtml.EscapeString(content))
                m = append(m, s)
        }
        return m
index 7a9887728f18dc078a2faf06aaa3e750f29467f9..659688bd0fdba3f3dc339df3b54faa55e88d9a2e 100644 (file)
@@ -4,21 +4,36 @@
 package highlight
 
 import (
+       "html/template"
        "strings"
        "testing"
 
        "github.com/stretchr/testify/assert"
 )
 
-func lines(s string) []string {
-       return strings.Split(strings.ReplaceAll(strings.TrimSpace(s), `\n`, "\n"), "\n")
+func lines(s string) (out []template.HTML) {
+       // "" => [], "a" => ["a"], "a\n" => ["a\n"], "a\nb" => ["a\n", "b"] (each line always includes EOL "\n" if it exists)
+       out = make([]template.HTML, 0)
+       s = strings.ReplaceAll(strings.ReplaceAll(strings.TrimSpace(s), "\n", ""), `\n`, "\n")
+       for {
+               if p := strings.IndexByte(s, '\n'); p != -1 {
+                       out = append(out, template.HTML(s[:p+1]))
+                       s = s[p+1:]
+               } else {
+                       break
+               }
+       }
+       if s != "" {
+               out = append(out, template.HTML(s))
+       }
+       return out
 }
 
 func TestFile(t *testing.T) {
        tests := []struct {
                name      string
                code      string
-               want      []string
+               want      []template.HTML
                lexerName string
        }{
                {
@@ -99,10 +114,7 @@ c=2
                t.Run(tt.name, func(t *testing.T) {
                        out, lexerName, err := File(tt.name, "", []byte(tt.code))
                        assert.NoError(t, err)
-                       expected := strings.Join(tt.want, "\n")
-                       actual := strings.Join(out, "\n")
-                       assert.Equal(t, strings.Count(actual, "<span"), strings.Count(actual, "</span>"))
-                       assert.EqualValues(t, expected, actual)
+                       assert.EqualValues(t, tt.want, out)
                        assert.Equal(t, tt.lexerName, lexerName)
                })
        }
@@ -112,7 +124,7 @@ func TestPlainText(t *testing.T) {
        tests := []struct {
                name string
                code string
-               want []string
+               want []template.HTML
        }{
                {
                        name: "empty.py",
@@ -165,9 +177,7 @@ c=2`),
        for _, tt := range tests {
                t.Run(tt.name, func(t *testing.T) {
                        out := PlainText([]byte(tt.code))
-                       expected := strings.Join(tt.want, "\n")
-                       actual := strings.Join(out, "\n")
-                       assert.EqualValues(t, expected, actual)
+                       assert.EqualValues(t, tt.want, out)
                })
        }
 }
index fdb468df1ab5bf5e690e7e14b6d695556fed3a00..e19e22eea0e1e5d7bd802ddff911bb9fd6f465c9 100644 (file)
@@ -6,6 +6,7 @@ package code
 import (
        "bytes"
        "context"
+       "html/template"
        "strings"
 
        "code.gitea.io/gitea/modules/highlight"
@@ -22,7 +23,7 @@ type Result struct {
        Language       string
        Color          string
        LineNumbers    []int
-       FormattedLines string
+       FormattedLines template.HTML
 }
 
 type SearchResultLanguages = internal.SearchResultLanguages
index c1e0144199323bfb3954fda905888d912647b496..e7af02b49670f716c9b9d8cf36b649a9a0707f56 100644 (file)
@@ -87,7 +87,7 @@ func Render(ctx *markup.RenderContext, input io.Reader, output io.Writer) error
                        }
                        lexer = chroma.Coalesce(lexer)
 
-                       if _, err := w.WriteString(highlight.CodeFromLexer(lexer, source)); err != nil {
+                       if _, err := w.WriteString(string(highlight.CodeFromLexer(lexer, source))); err != nil {
                                return ""
                        }
                }
index 31042d3ee0dda589368b452345b19a4f540217e2..f94e6206cd995c6e8afbb9b2dad5eae90b454ae4 100644 (file)
@@ -35,6 +35,8 @@ var UI = struct {
        OnlyShowRelevantRepos bool
        ExploreDefaultSort    string `ini:"EXPLORE_PAGING_DEFAULT_SORT"`
 
+       AmbiguousUnicodeDetection bool
+
        Notification struct {
                MinTimeout            time.Duration
                TimeoutStep           time.Duration
@@ -82,6 +84,9 @@ var UI = struct {
        Reactions:           []string{`+1`, `-1`, `laugh`, `hooray`, `confused`, `heart`, `rocket`, `eyes`},
        CustomEmojis:        []string{`git`, `gitea`, `codeberg`, `gitlab`, `github`, `gogs`},
        CustomEmojisMap:     map[string]string{"git": ":git:", "gitea": ":gitea:", "codeberg": ":codeberg:", "gitlab": ":gitlab:", "github": ":github:", "gogs": ":gogs:"},
+
+       AmbiguousUnicodeDetection: true,
+
        Notification: struct {
                MinTimeout            time.Duration
                TimeoutStep           time.Duration
index f2def7b0ece2c56cfa9f81d306763ee8f06ef563..2cf44d29b1f0ab8ea00f1777f29661261cb8b014 100644 (file)
@@ -3,7 +3,7 @@
 
 package util
 
-import "github.com/yuin/goldmark/util"
+import "unsafe"
 
 func isSnakeCaseUpper(c byte) bool {
        return 'A' <= c && c <= 'Z'
@@ -83,5 +83,15 @@ func ToSnakeCase(input string) string {
                        }
                }
        }
-       return util.BytesToReadOnlyString(res)
+       return UnsafeBytesToString(res)
+}
+
+// UnsafeBytesToString uses Go's unsafe package to convert a byte slice to a string.
+// TODO: replace all "goldmark/util.BytesToReadOnlyString" with this official approach
+func UnsafeBytesToString(b []byte) string {
+       return unsafe.String(unsafe.SliceData(b), len(b))
+}
+
+func UnsafeStringToBytes(s string) []byte {
+       return unsafe.Slice(unsafe.StringData(s), len(s))
 }
index db9be51257e7ffa21bf7607227ae99b9e6d7283c..b2374e32c28493b1371b29719ffa6e290ee2cceb 100644 (file)
@@ -315,8 +315,7 @@ func renderBlame(ctx *context.Context, blameParts []git.BlamePart, commitNames m
                                lexerName = lexerNameForLine
                        }
 
-                       br.EscapeStatus, line = charset.EscapeControlHTML(line, ctx.Locale)
-                       br.Code = gotemplate.HTML(line)
+                       br.EscapeStatus, br.Code = charset.EscapeControlHTML(line, ctx.Locale)
                        rows = append(rows, br)
                        escapeStatus = escapeStatus.Or(br.EscapeStatus)
                }
index 70556185bb53bed1f204bac5ba56194c288ba3a9..9cf0dff5d8e2fddcf09dcc9326222ec9c9df64a8 100644 (file)
@@ -9,6 +9,7 @@ import (
        gocontext "context"
        "encoding/base64"
        "fmt"
+       "html/template"
        "image"
        "io"
        "net/http"
@@ -317,19 +318,18 @@ func renderReadmeFile(ctx *context.Context, subfolder string, readmeFile *git.Tr
                }, rd)
                if err != nil {
                        log.Error("Render failed for %s in %-v: %v Falling back to rendering source", readmeFile.Name(), ctx.Repo.Repository, err)
-                       buf := &bytes.Buffer{}
-                       ctx.Data["EscapeStatus"], _ = charset.EscapeControlStringReader(rd, buf, ctx.Locale)
-                       ctx.Data["FileContent"] = buf.String()
+                       delete(ctx.Data, "IsMarkup")
                }
-       } else {
+       }
+
+       if ctx.Data["IsMarkup"] != true {
                ctx.Data["IsPlainText"] = true
-               buf := &bytes.Buffer{}
-               ctx.Data["EscapeStatus"], err = charset.EscapeControlStringReader(rd, buf, ctx.Locale)
+               content, err := io.ReadAll(rd)
                if err != nil {
-                       log.Error("Read failed: %v", err)
+                       log.Error("Read readme content failed: %v", err)
                }
-
-               ctx.Data["FileContent"] = buf.String()
+               contentEscaped := template.HTMLEscapeString(util.UnsafeBytesToString(content))
+               ctx.Data["EscapeStatus"], ctx.Data["FileContent"] = charset.EscapeControlHTML(template.HTML(contentEscaped), ctx.Locale)
        }
 
        if !fInfo.isLFSFile && ctx.Repo.CanEnableEditor(ctx, ctx.Doer) {
@@ -493,7 +493,7 @@ func renderFile(ctx *context.Context, entry *git.TreeEntry, treeLink, rawLink st
                        buf, _ := io.ReadAll(rd)
 
                        // The Open Group Base Specification: https://pubs.opengroup.org/onlinepubs/9699919799/basedefs/V1_chap03.html
-                       //   empty: 0 lines; "a": 1 line, 1 incomplete-line; "a\n": 1 line; "a\nb": 1 line, 1 incomplete-line;
+                       //   empty: 0 lines; "a": 1 incomplete-line; "a\n": 1 line; "a\nb": 1 line, 1 incomplete-line;
                        // Gitea uses the definition (like most modern editors):
                        //   empty: 0 lines; "a": 1 line; "a\n": 2 lines; "a\nb": 2 lines;
                        //   When rendering, the last empty line is not rendered in UI, while the line-number is still counted, to tell users that the file contains a trailing EOL.
@@ -620,7 +620,7 @@ func renderFile(ctx *context.Context, entry *git.TreeEntry, treeLink, rawLink st
        }
 }
 
-func markupRender(ctx *context.Context, renderCtx *markup.RenderContext, input io.Reader) (escaped *charset.EscapeStatus, output string, err error) {
+func markupRender(ctx *context.Context, renderCtx *markup.RenderContext, input io.Reader) (escaped *charset.EscapeStatus, output template.HTML, err error) {
        markupRd, markupWr := io.Pipe()
        defer markupWr.Close()
        done := make(chan struct{})
@@ -628,7 +628,7 @@ func markupRender(ctx *context.Context, renderCtx *markup.RenderContext, input i
                sb := &strings.Builder{}
                // We allow NBSP here this is rendered
                escaped, _ = charset.EscapeControlReader(markupRd, sb, ctx.Locale, charset.RuneNBSP)
-               output = sb.String()
+               output = template.HTML(sb.String())
                close(done)
        }()
        err = markup.Render(renderCtx, input, markupWr)
index 75fc687c86a523fc8ac686fb90c694550e5aa21d..0f6e2b6c17d5b18c56016c647bf38f3188aeea65 100644 (file)
@@ -285,15 +285,15 @@ type DiffInline struct {
 
 // DiffInlineWithUnicodeEscape makes a DiffInline with hidden unicode characters escaped
 func DiffInlineWithUnicodeEscape(s template.HTML, locale translation.Locale) DiffInline {
-       status, content := charset.EscapeControlHTML(string(s), locale)
-       return DiffInline{EscapeStatus: status, Content: template.HTML(content)}
+       status, content := charset.EscapeControlHTML(s, locale)
+       return DiffInline{EscapeStatus: status, Content: content}
 }
 
 // DiffInlineWithHighlightCode makes a DiffInline with code highlight and hidden unicode characters escaped
 func DiffInlineWithHighlightCode(fileName, language, code string, locale translation.Locale) DiffInline {
        highlighted, _ := highlight.Code(fileName, language, code)
        status, content := charset.EscapeControlHTML(highlighted, locale)
-       return DiffInline{EscapeStatus: status, Content: template.HTML(content)}
+       return DiffInline{EscapeStatus: status, Content: content}
 }
 
 // GetComputedInlineDiffFor computes inline diff for the given line.
index f1e2b1d3cb31a6f5e94cbc84f30005c19b9121cd..35d48445504aea3ece577b63e12e7582fdeab7bb 100644 (file)
@@ -93,10 +93,10 @@ func (hcd *highlightCodeDiff) diffWithHighlight(filename, language, codeA, codeB
        highlightCodeA, _ := highlight.Code(filename, language, codeA)
        highlightCodeB, _ := highlight.Code(filename, language, codeB)
 
-       highlightCodeA = hcd.convertToPlaceholders(highlightCodeA)
-       highlightCodeB = hcd.convertToPlaceholders(highlightCodeB)
+       convertedCodeA := hcd.convertToPlaceholders(string(highlightCodeA))
+       convertedCodeB := hcd.convertToPlaceholders(string(highlightCodeB))
 
-       diffs := diffMatchPatch.DiffMain(highlightCodeA, highlightCodeB, true)
+       diffs := diffMatchPatch.DiffMain(convertedCodeA, convertedCodeB, true)
        diffs = diffMatchPatch.DiffCleanupEfficiency(diffs)
 
        for i := range diffs {
index 4129a133b7e762565c881d2436c2dfe54fd88968..e7d1c04c12ef26cf0df2c9d31a9a36726290c20b 100644 (file)
@@ -74,9 +74,9 @@
                {{end}}
                <div class="file-view{{if .IsMarkup}} markup {{.MarkupType}}{{else if .IsPlainText}} plain-text{{else if .IsTextSource}} code-view{{end}}">
                        {{if .IsMarkup}}
-                               {{if .FileContent}}{{.FileContent | Safe}}{{end}}
+                               {{if .FileContent}}{{.FileContent}}{{end}}
                        {{else if .IsPlainText}}
-                               <pre>{{if .FileContent}}{{.FileContent | Safe}}{{end}}</pre>
+                               <pre>{{if .FileContent}}{{.FileContent}}{{end}}</pre>
                        {{else if not .IsTextSource}}
                                <div class="view-raw">
                                        {{if .IsImageFile}}
                                                        {{if $.EscapeStatus.Escaped}}
                                                                <td class="lines-escape">{{if (index $.LineEscapeStatus $idx).Escaped}}<button class="toggle-escape-button btn interact-bg" title="{{if (index $.LineEscapeStatus $idx).HasInvisible}}{{ctx.Locale.Tr "repo.invisible_runes_line"}} {{end}}{{if (index $.LineEscapeStatus $idx).HasAmbiguous}}{{ctx.Locale.Tr "repo.ambiguous_runes_line"}}{{end}}"></button>{{end}}</td>
                                                        {{end}}
-                                                       <td rel="L{{$line}}" class="lines-code chroma"><code class="code-inner">{{$code | Safe}}</code></td>
+                                                       <td rel="L{{$line}}" class="lines-code chroma"><code class="code-inner">{{$code}}</code></td>
                                                </tr>
                                                {{end}}
                                        </tbody>