Skip extra objects in object stream in using offsets

2025-04-22 16:18:08 +02:00 · 2021-03-27 18:45:48 +01:00 · 2021-03-27 18:45:48 +01:00 · 9296ee6986
commit 9296ee6986
parent 81c602c61c
4 changed files with 37 additions and 10 deletions
--- a/src/core/obj.js
+++ b/src/core/obj.js
@ -2151,12 +2151,13 @@ var XRef = (function XRefClosure() {
          "invalid first and n parameters for ObjStm stream"
        );
      }
-      const parser = new Parser({
+      let parser = new Parser({
        lexer: new Lexer(stream),
        xref: this,
        allowStreams: true,
      });
      const nums = new Array(n);
+      const offsets = new Array(n);
      // read the object numbers to populate cache
      for (let i = 0; i < n; ++i) {
        const num = parser.getObj();
@ -2172,17 +2173,27 @@ var XRef = (function XRefClosure() {
          );
        }
        nums[i] = num;
+        offsets[i] = offset;
      }
+
+      const start = (stream.start || 0) + first;
      const entries = new Array(n);
      // read stream objects for cache
      for (let i = 0; i < n; ++i) {
+        const length = i < n - 1 ? offsets[i + 1] - offsets[i] : undefined;
+        if (length < 0) {
+          throw new FormatError("Invalid offset in the ObjStm stream.");
+        }
+        parser = new Parser({
+          lexer: new Lexer(
+            stream.makeSubStream(start + offsets[i], length, stream.dict)
+          ),
+          xref: this,
+          allowStreams: true,
+        });
+
        const obj = parser.getObj();
        entries[i] = obj;
-        // The ObjStm should not contain 'endobj'. If it's present, skip over it
-        // to support corrupt PDFs (fixes issue 5241, bug 898610, bug 1037816).
-        if (parser.buf1 instanceof Cmd && parser.buf1.cmd === "endobj") {
-          parser.shift();
-        }
        if (isStream(obj)) {
          continue;
        }
--- a/src/core/stream.js
+++ b/src/core/stream.js
@ -259,9 +259,15 @@ var DecodeStream = (function DecodeStreamClosure() {
      return bytes;
    },
    makeSubStream: function DecodeStream_makeSubStream(start, length, dict) {
-      var end = start + length;
-      while (this.bufferLength <= end && !this.eof) {
-        this.readBlock();
+      if (length === undefined) {
+        while (!this.eof) {
+          this.readBlock();
+        }
+      } else {
+        var end = start + length;
+        while (this.bufferLength <= end && !this.eof) {
+          this.readBlock();
+        }
      }
      return new Stream(this.buffer, start, length, dict);
    },