mirror of
https://github.com/mozilla/pdf.js.git
synced 2025-04-20 07:08:08 +02:00
Redid encoding
This commit is contained in:
parent
8e8fb748ac
commit
aeba156d6b
1 changed files with 123 additions and 106 deletions
229
pdf.js
229
pdf.js
|
@ -4213,118 +4213,135 @@ var PartialEvaluator = (function() {
|
|||
'9.7.5.3');
|
||||
}
|
||||
}
|
||||
} else if (fontDict.has('Encoding')) {
|
||||
var encoding = xref.fetchIfRef(fontDict.get('Encoding'));
|
||||
if (IsDict(encoding)) {
|
||||
// Build a map of between codes and glyphs
|
||||
// Load the base encoding
|
||||
var baseName = encoding.get('BaseEncoding');
|
||||
if (baseName) {
|
||||
var base = Encodings[baseName.name];
|
||||
for (var j = 0, end = base.length; j < end; j++)
|
||||
encodingMap[j] = GlyphsUnicode[base[j]] || 0;
|
||||
} else {
|
||||
TODO('need to load default encoding');
|
||||
}
|
||||
|
||||
// Load the differences between the base and original
|
||||
var differences = encoding.get('Differences');
|
||||
var index = 0;
|
||||
for (var j = 0; j < differences.length; j++) {
|
||||
var data = differences[j];
|
||||
if (IsNum(data)) {
|
||||
index = data;
|
||||
} else {
|
||||
encodingMap[index++] = (subType.name == 'TrueType') ? j :
|
||||
GlyphsUnicode[data.name];
|
||||
} else {
|
||||
var baseEncoding = null, diffEncoding = [];
|
||||
if (fontDict.has('Encoding')) {
|
||||
var encoding = xref.fetchIfRef(fontDict.get('Encoding'));
|
||||
if (IsDict(encoding)) {
|
||||
// Build a map of between codes and glyphs
|
||||
// Load the base encoding
|
||||
var baseName = encoding.get('BaseEncoding');
|
||||
if (baseName) {
|
||||
baseEncoding = Encodings[baseName.name].slice();
|
||||
}
|
||||
}
|
||||
} else if (IsName(encoding)) {
|
||||
var encoding = Encodings[encoding.name];
|
||||
if (!encoding)
|
||||
error('Unknown font encoding');
|
||||
|
||||
var index = 0;
|
||||
for (var j = 0; j < encoding.length; j++)
|
||||
encodingMap[index++] = GlyphsUnicode[encoding[j]];
|
||||
|
||||
// firstChar and width are required
|
||||
// (except for 14 standard fonts)
|
||||
var firstChar = xref.fetchIfRef(fontDict.get('FirstChar'));
|
||||
var widths = xref.fetchIfRef(fontDict.get('Widths')) || [];
|
||||
for (var j = 0; j < widths.length; j++) {
|
||||
if (widths[j])
|
||||
charset.push(encoding[j + firstChar]);
|
||||
}
|
||||
}
|
||||
} else if (fontDict.has('ToUnicode')) {
|
||||
encodingMap = {empty: true};
|
||||
var cmapObj = xref.fetchIfRef(fontDict.get('ToUnicode'));
|
||||
if (IsName(cmapObj)) {
|
||||
error('ToUnicode file cmap translation not implemented');
|
||||
} else if (IsStream(cmapObj)) {
|
||||
var encoding = Encodings['WinAnsiEncoding'];
|
||||
var firstChar = xref.fetchIfRef(fontDict.get('FirstChar'));
|
||||
|
||||
var tokens = [];
|
||||
var token = '';
|
||||
|
||||
var cmap = cmapObj.getBytes(cmapObj.length);
|
||||
for (var i = 0; i < cmap.length; i++) {
|
||||
var byte = cmap[i];
|
||||
if (byte == 0x20 || byte == 0x0A || byte == 0x3C || byte == 0x3E) {
|
||||
switch (token) {
|
||||
case 'useCMap':
|
||||
error('useCMap is not implemented');
|
||||
break;
|
||||
|
||||
case 'beginbfchar':
|
||||
case 'beginbfrange':
|
||||
case 'begincodespacerange':
|
||||
token = '';
|
||||
tokens = [];
|
||||
break;
|
||||
|
||||
case 'endcodespacerange':
|
||||
TODO('Support CMap ranges');
|
||||
break;
|
||||
|
||||
case 'endbfrange':
|
||||
for (var j = 0; j < tokens.length; j += 3) {
|
||||
var startRange = parseInt('0x' + tokens[j]);
|
||||
var endRange = parseInt('0x' + tokens[j + 1]);
|
||||
var code = parseInt('0x' + tokens[j + 2]);
|
||||
|
||||
for (var k = startRange; k <= endRange; k++) {
|
||||
charset.push(encoding[code++] || '.notdef');
|
||||
}
|
||||
}
|
||||
break;
|
||||
|
||||
case 'endbfchar':
|
||||
for (var j = 0; j < tokens.length; j += 2) {
|
||||
var index = parseInt('0x' + tokens[j]);
|
||||
var code = parseInt('0x' + tokens[j + 1]);
|
||||
encodingMap[index] = GlyphsUnicode[encoding[code]];
|
||||
charset.push(encoding[code] || '.notdef');
|
||||
}
|
||||
break;
|
||||
|
||||
default:
|
||||
if (token.length) {
|
||||
tokens.push(token);
|
||||
token = '';
|
||||
}
|
||||
break;
|
||||
// Load the differences between the base and original
|
||||
var differences = encoding.get('Differences');
|
||||
var index = 0;
|
||||
for (var j = 0; j < differences.length; j++) {
|
||||
var data = differences[j];
|
||||
if (IsNum(data)) {
|
||||
index = data;
|
||||
} else {
|
||||
diffEncoding[index++] = data.name;
|
||||
}
|
||||
}
|
||||
} else if (IsName(encoding)) {
|
||||
baseEncoding = Encodings[encoding.name].slice();
|
||||
}
|
||||
}
|
||||
|
||||
if (!baseEncoding) {
|
||||
var type = subType.name;
|
||||
if (type == 'TrueType') {
|
||||
baseEncoding = Encodings.WinAnsiEncoding.slice(0);
|
||||
} else if (type == 'Type1') {
|
||||
baseEncoding = Encodings.StandardEncoding.slice(0);
|
||||
} else {
|
||||
error('Unknown type of font');
|
||||
}
|
||||
}
|
||||
|
||||
// merge in the differences
|
||||
var length = baseEncoding.length > diffEncoding.length ?
|
||||
baseEncoding.length : diffEncoding.length;
|
||||
for (var i = 0, ii = length; i < ii; ++i) {
|
||||
var diffGlyph = diffEncoding[i];
|
||||
var baseGlyph = baseEncoding[i];
|
||||
if (diffGlyph)
|
||||
encodingMap[i] = GlyphsUnicode[diffGlyph];
|
||||
else if (baseGlyph)
|
||||
encodingMap[i] = GlyphsUnicode[baseGlyph];
|
||||
}
|
||||
|
||||
if (fontDict.has('ToUnicode')) {
|
||||
encodingMap = {empty: true};
|
||||
var cmapObj = xref.fetchIfRef(fontDict.get('ToUnicode'));
|
||||
if (IsName(cmapObj)) {
|
||||
error('ToUnicode file cmap translation not implemented');
|
||||
} else if (IsStream(cmapObj)) {
|
||||
var encoding = Encodings['WinAnsiEncoding'];
|
||||
var firstChar = xref.fetchIfRef(fontDict.get('FirstChar'));
|
||||
|
||||
var tokens = [];
|
||||
var token = '';
|
||||
|
||||
var cmap = cmapObj.getBytes(cmapObj.length);
|
||||
for (var i = 0; i < cmap.length; i++) {
|
||||
var byte = cmap[i];
|
||||
if (byte == 0x20 || byte == 0x0A || byte == 0x3C || byte == 0x3E) {
|
||||
switch (token) {
|
||||
case 'useCMap':
|
||||
error('useCMap is not implemented');
|
||||
break;
|
||||
|
||||
case 'beginbfchar':
|
||||
case 'beginbfrange':
|
||||
case 'begincodespacerange':
|
||||
token = '';
|
||||
tokens = [];
|
||||
break;
|
||||
|
||||
case 'endcodespacerange':
|
||||
TODO('Support CMap ranges');
|
||||
break;
|
||||
|
||||
case 'endbfrange':
|
||||
for (var j = 0; j < tokens.length; j += 3) {
|
||||
var startRange = parseInt('0x' + tokens[j]);
|
||||
var endRange = parseInt('0x' + tokens[j + 1]);
|
||||
var code = parseInt('0x' + tokens[j + 2]);
|
||||
|
||||
for (var k = startRange; k <= endRange; k++) {
|
||||
charset.push(encoding[code++] || '.notdef');
|
||||
}
|
||||
}
|
||||
break;
|
||||
|
||||
case 'endbfchar':
|
||||
for (var j = 0; j < tokens.length; j += 2) {
|
||||
var index = parseInt('0x' + tokens[j]);
|
||||
var code = parseInt('0x' + tokens[j + 1]);
|
||||
encodingMap[index] = GlyphsUnicode[encoding[code]];
|
||||
charset.push(encoding[code] || '.notdef');
|
||||
}
|
||||
break;
|
||||
|
||||
default:
|
||||
if (token.length) {
|
||||
tokens.push(token);
|
||||
token = '';
|
||||
}
|
||||
break;
|
||||
}
|
||||
} else if (byte == 0x5B || byte == 0x5D) {
|
||||
error('CMAP list parsing is not implemented');
|
||||
} else {
|
||||
token += String.fromCharCode(byte);
|
||||
}
|
||||
} else if (byte == 0x5B || byte == 0x5D) {
|
||||
error('CMAP list parsing is not implemented');
|
||||
} else {
|
||||
token += String.fromCharCode(byte);
|
||||
}
|
||||
}
|
||||
}
|
||||
}
|
||||
|
||||
/* // firstChar and width are required
|
||||
// (except for 14 standard fonts)
|
||||
var firstChar = xref.fetchIfRef(fontDict.get('FirstChar'));
|
||||
var widths = xref.fetchIfRef(fontDict.get('Widths')) || [];
|
||||
for (var j = 0; j < widths.length; j++) {
|
||||
if (widths[j])
|
||||
charset.push(encoding[j + firstChar]);
|
||||
}
|
||||
*/ }
|
||||
|
||||
if (!fd) {
|
||||
var baseFontName = fontDict.get('BaseFont');
|
||||
|
|
Loading…
Add table
Add a link
Reference in a new issue