]> source.dussan.org Git - gitea.git/commitdiff
Read expected buffer size (#17409)
authorKN4CK3R <admin@oldschoolhack.me>
Sun, 24 Oct 2021 21:12:43 +0000 (23:12 +0200)
committerGitHub <noreply@github.com>
Sun, 24 Oct 2021 21:12:43 +0000 (22:12 +0100)
* Read expected buffer size.

* Changed name.

modules/charset/charset.go
modules/csv/csv.go
modules/git/blob.go
modules/repofiles/update.go
modules/typesniffer/typesniffer.go
modules/util/io.go [new file with mode: 0644]
routers/common/repo.go
routers/web/repo/editor.go
routers/web/repo/lfs.go
routers/web/repo/view.go
services/attachment/attachment.go

index 47906e26383201bab31beff4ce0c8bce6d15ce3d..ae5cf5aa1a4eb5ce19fb4a5a09082fea19fe5c31 100644 (file)
@@ -13,6 +13,7 @@ import (
 
        "code.gitea.io/gitea/modules/log"
        "code.gitea.io/gitea/modules/setting"
+       "code.gitea.io/gitea/modules/util"
 
        "github.com/gogs/chardet"
        "golang.org/x/net/html/charset"
@@ -25,9 +26,9 @@ var UTF8BOM = []byte{'\xef', '\xbb', '\xbf'}
 // ToUTF8WithFallbackReader detects the encoding of content and coverts to UTF-8 reader if possible
 func ToUTF8WithFallbackReader(rd io.Reader) io.Reader {
        var buf = make([]byte, 2048)
-       n, err := rd.Read(buf)
+       n, err := util.ReadAtMost(rd, buf)
        if err != nil {
-               return rd
+               return io.MultiReader(bytes.NewReader(RemoveBOMIfPresent(buf[:n])), rd)
        }
 
        charsetLabel, err := DetectEncoding(buf[:n])
index 30698830a478dc4b763b4d52acc9fa90aec309e4..2e2611aa813001913bd2ef0fcbc44015fa993051 100644 (file)
@@ -29,11 +29,8 @@ func CreateReader(input io.Reader, delimiter rune) *stdcsv.Reader {
 // CreateReaderAndGuessDelimiter tries to guess the field delimiter from the content and creates a csv.Reader.
 func CreateReaderAndGuessDelimiter(rd io.Reader) (*stdcsv.Reader, error) {
        var data = make([]byte, 1e4)
-       size, err := rd.Read(data)
+       size, err := util.ReadAtMost(rd, data)
        if err != nil {
-               if err == io.EOF {
-                       return CreateReader(bytes.NewReader([]byte{}), rune(',')), nil
-               }
                return nil, err
        }
 
index c7919f3c41336f4d2eb6938bdbeb02990c320a98..9567affd037459582ba8f1d102f8c26e65c1969a 100644 (file)
@@ -11,6 +11,7 @@ import (
        "io"
 
        "code.gitea.io/gitea/modules/typesniffer"
+       "code.gitea.io/gitea/modules/util"
 )
 
 // This file contains common functions between the gogit and !gogit variants for git Blobs
@@ -28,7 +29,7 @@ func (b *Blob) GetBlobContent() (string, error) {
        }
        defer dataRc.Close()
        buf := make([]byte, 1024)
-       n, _ := dataRc.Read(buf)
+       n, _ := util.ReadAtMost(dataRc, buf)
        buf = buf[:n]
        return string(buf), nil
 }
index dc2893cb1c3501fd19505a29fa4b3ad5918bf049..d25accff1873a4f3560b6187e9d81d5a17d054e2 100644 (file)
@@ -19,6 +19,7 @@ import (
        repo_module "code.gitea.io/gitea/modules/repository"
        "code.gitea.io/gitea/modules/setting"
        "code.gitea.io/gitea/modules/structs"
+       "code.gitea.io/gitea/modules/util"
 
        stdcharset "golang.org/x/net/html/charset"
        "golang.org/x/text/transform"
@@ -61,7 +62,7 @@ func detectEncodingAndBOM(entry *git.TreeEntry, repo *models.Repository) (string
        }
        defer reader.Close()
        buf := make([]byte, 1024)
-       n, err := reader.Read(buf)
+       n, err := util.ReadAtMost(reader, buf)
        if err != nil {
                // return default
                return "UTF-8", false
@@ -84,7 +85,7 @@ func detectEncodingAndBOM(entry *git.TreeEntry, repo *models.Repository) (string
                                }
                                defer dataRc.Close()
                                buf = make([]byte, 1024)
-                               n, err = dataRc.Read(buf)
+                               n, err = util.ReadAtMost(dataRc, buf)
                                if err != nil {
                                        // return default
                                        return "UTF-8", false
index d257b8179b0ad2aa1fc94408c064c737a23666cc..9e29b3557c4ac6b4ab4da55f506dca7c2a4d73fc 100644 (file)
@@ -10,6 +10,8 @@ import (
        "net/http"
        "regexp"
        "strings"
+
+       "code.gitea.io/gitea/modules/util"
 )
 
 // Use at most this many bytes to determine Content Type.
@@ -86,8 +88,8 @@ func DetectContentType(data []byte) SniffedType {
 // DetectContentTypeFromReader guesses the content type contained in the reader.
 func DetectContentTypeFromReader(r io.Reader) (SniffedType, error) {
        buf := make([]byte, sniffLen)
-       n, err := r.Read(buf)
-       if err != nil && err != io.EOF {
+       n, err := util.ReadAtMost(r, buf)
+       if err != nil {
                return SniffedType{}, fmt.Errorf("DetectContentTypeFromReader io error: %w", err)
        }
        buf = buf[:n]
diff --git a/modules/util/io.go b/modules/util/io.go
new file mode 100644 (file)
index 0000000..b467c0a
--- /dev/null
@@ -0,0 +1,20 @@
+// Copyright 2021 The Gitea Authors. All rights reserved.
+// Use of this source code is governed by a MIT-style
+// license that can be found in the LICENSE file.
+
+package util
+
+import (
+       "io"
+)
+
+// ReadAtMost reads at most len(buf) bytes from r into buf.
+// It returns the number of bytes copied. n is only less then len(buf) if r provides fewer bytes.
+// If EOF occurs while reading, err will be nil.
+func ReadAtMost(r io.Reader, buf []byte) (n int, err error) {
+       n, err = io.ReadFull(r, buf)
+       if err == io.EOF || err == io.ErrUnexpectedEOF {
+               err = nil
+       }
+       return
+}
index af9170164e9259ea2ed2b32fb8bcde841d07a35e..b0e14b63f542c5c36a3a37701fcb2771201ae7d2 100644 (file)
@@ -18,6 +18,7 @@ import (
        "code.gitea.io/gitea/modules/log"
        "code.gitea.io/gitea/modules/setting"
        "code.gitea.io/gitea/modules/typesniffer"
+       "code.gitea.io/gitea/modules/util"
 )
 
 // ServeBlob download a git.Blob
@@ -42,8 +43,8 @@ func ServeBlob(ctx *context.Context, blob *git.Blob) error {
 // ServeData download file from io.Reader
 func ServeData(ctx *context.Context, name string, size int64, reader io.Reader) error {
        buf := make([]byte, 1024)
-       n, err := reader.Read(buf)
-       if err != nil && err != io.EOF {
+       n, err := util.ReadAtMost(reader, buf)
+       if err != nil {
                return err
        }
        if n >= 0 {
index 1d18bfe9a908a01b1aaac42d7df05fcd49a998b0..f27258349953935142fb44606b5e56ac3836c4c0 100644 (file)
@@ -118,7 +118,7 @@ func editFile(ctx *context.Context, isNewFile bool) {
                ctx.Data["FileName"] = blob.Name()
 
                buf := make([]byte, 1024)
-               n, _ := dataRc.Read(buf)
+               n, _ := util.ReadAtMost(dataRc, buf)
                buf = buf[:n]
 
                // Only some file types are editable online as text.
@@ -751,7 +751,7 @@ func UploadFileToServer(ctx *context.Context) {
        defer file.Close()
 
        buf := make([]byte, 1024)
-       n, _ := file.Read(buf)
+       n, _ := util.ReadAtMost(file, buf)
        if n > 0 {
                buf = buf[:n]
        }
index 271c6385537179ad22d3bb9dc60a0896329f2d95..5e24cfa3c0a88a52d3a6c362e103a718eeb9b56b 100644 (file)
@@ -25,6 +25,7 @@ import (
        "code.gitea.io/gitea/modules/setting"
        "code.gitea.io/gitea/modules/storage"
        "code.gitea.io/gitea/modules/typesniffer"
+       "code.gitea.io/gitea/modules/util"
 )
 
 const (
@@ -271,7 +272,7 @@ func LFSFileGet(ctx *context.Context) {
        }
        defer dataRc.Close()
        buf := make([]byte, 1024)
-       n, err := dataRc.Read(buf)
+       n, err := util.ReadAtMost(dataRc, buf)
        if err != nil {
                ctx.ServerError("Data", err)
                return
@@ -296,10 +297,10 @@ func LFSFileGet(ctx *context.Context) {
                        break
                }
 
-               buf := charset.ToUTF8WithFallbackReader(io.MultiReader(bytes.NewReader(buf), dataRc))
+               rd := charset.ToUTF8WithFallbackReader(io.MultiReader(bytes.NewReader(buf), dataRc))
 
                // Building code view blocks with line number on server side.
-               fileContent, _ := io.ReadAll(buf)
+               fileContent, _ := io.ReadAll(rd)
 
                var output bytes.Buffer
                lines := strings.Split(string(fileContent), "\n")
index 0777a10e7b9a639bac994b3847c913c418efcf71..90be631c734991186cb8686919e8bef2cdc1d805 100644 (file)
@@ -33,6 +33,7 @@ import (
        "code.gitea.io/gitea/modules/setting"
        "code.gitea.io/gitea/modules/structs"
        "code.gitea.io/gitea/modules/typesniffer"
+       "code.gitea.io/gitea/modules/util"
 )
 
 const (
@@ -250,7 +251,7 @@ func renderDirectory(ctx *context.Context, treeLink string) {
                defer dataRc.Close()
 
                buf := make([]byte, 1024)
-               n, _ := dataRc.Read(buf)
+               n, _ := util.ReadAtMost(dataRc, buf)
                buf = buf[:n]
 
                st := typesniffer.DetectContentType(buf)
@@ -285,7 +286,7 @@ func renderDirectory(ctx *context.Context, treeLink string) {
                                        defer dataRc.Close()
 
                                        buf = make([]byte, 1024)
-                                       n, err = dataRc.Read(buf)
+                                       n, err = util.ReadAtMost(dataRc, buf)
                                        if err != nil {
                                                ctx.ServerError("Data", err)
                                                return
@@ -377,7 +378,7 @@ func renderFile(ctx *context.Context, entry *git.TreeEntry, treeLink, rawLink st
        ctx.Data["RawFileLink"] = rawLink + "/" + ctx.Repo.TreePath
 
        buf := make([]byte, 1024)
-       n, _ := dataRc.Read(buf)
+       n, _ := util.ReadAtMost(dataRc, buf)
        buf = buf[:n]
 
        st := typesniffer.DetectContentType(buf)
@@ -409,10 +410,8 @@ func renderFile(ctx *context.Context, entry *git.TreeEntry, treeLink, rawLink st
                                defer dataRc.Close()
 
                                buf = make([]byte, 1024)
-                               n, err = dataRc.Read(buf)
-                               // Error EOF don't mean there is an error, it just means we read to
-                               // the end
-                               if err != nil && err != io.EOF {
+                               n, err = util.ReadAtMost(dataRc, buf)
+                               if err != nil {
                                        ctx.ServerError("Data", err)
                                        return
                                }
index 7500a8ac3a6509291271c114495b7b35b2921bf7..f747ccec3ea171f8928670ad40c47ae2d73fe866 100644 (file)
@@ -14,6 +14,7 @@ import (
        "code.gitea.io/gitea/models/db"
        "code.gitea.io/gitea/modules/storage"
        "code.gitea.io/gitea/modules/upload"
+       "code.gitea.io/gitea/modules/util"
 
        "github.com/google/uuid"
 )
@@ -41,10 +42,8 @@ func NewAttachment(attach *models.Attachment, file io.Reader) (*models.Attachmen
 // UploadAttachment upload new attachment into storage and update database
 func UploadAttachment(file io.Reader, actorID, repoID, releaseID int64, fileName string, allowedTypes string) (*models.Attachment, error) {
        buf := make([]byte, 1024)
-       n, _ := file.Read(buf)
-       if n > 0 {
-               buf = buf[:n]
-       }
+       n, _ := util.ReadAtMost(file, buf)
+       buf = buf[:n]
 
        if err := upload.Verify(buf, fileName, allowedTypes); err != nil {
                return nil, err