PDA

Просмотр полной версии : Задача count chars in *doc file


Jamal Suyarov
29.05.2008, 11:03
Вобщем есть задача надо посчитать количество печатных символов в *.doc файле, если кто то с этим сталкивался или есть какие то мысли
буду очень благодарен за внимание или решение данной задачи

Jamal Suyarov
29.05.2008, 11:39
пришла мысль
так как хостинг никсовый com объекты отпадают , значит надо найти конвертер doc в rtf

Jamal Suyarov
29.05.2008, 12:27
всем сапасибо

_TrachinuS_
29.05.2008, 12:30
А ты сайт на чем пишеш?

JH
29.05.2008, 13:01
всем сапасибо

Это вы обижаетесь за то, что вам за целых 1 час 24 минуты никто не ответил? Действительно, хамство со стороны публики.

_TrachinuS_
29.05.2008, 15:01
Мдяя.... Если он сам намана не поставил задачу, то кто может ее решить ?

Jamal Suyarov
29.05.2008, 16:06
А ты сайт на чем пишеш?
php

Jamal Suyarov
29.05.2008, 16:08
всем сапасибо как и обчно происходит решения нашожу сам спасибо без обид

Jamal Suyarov
29.05.2008, 16:09
Мдяя.... Если он сам намана не поставил задачу, то кто может ее решить ?
вы правы

Timur Bazikalov
29.05.2008, 20:44
Цитата: Сообщение от Jamal SuyarOFF Посмотреть сообщение всем сапасибо как и обчно происходит решения нашожу сам спасибо без обид
Так может выложишь его? Или копирайт?

YUU
29.05.2008, 22:32
если речь не идет об автоматическом подсчете через интерфейс сайта то есть функция word count в ворде....

или http://www.translation3000.com/aitpn/189.htm когда нужно посчитать сразу несколько документов...

может можно подключить это к сайту?

Jamal Suyarov
30.05.2008, 10:12
если речь не идет об автоматическом подсчете через интерфейс сайта то есть функция word count в ворде....
есть такая но не подходит для для руских кодировок

Jamal Suyarov
30.05.2008, 10:14
по конвертации бинарного doc файла есть люди добрые (http://obbot.com/obninsk_doc/)
остальное дело подхода к задачи

Rustam Khamidov
30.05.2008, 10:18
Просвятите, кто разбирается в следующем моменте.
Если просматривать в винде свойства .doc файла, то на одной из вкладок винда показывает статистика по документу (кол-во слов и т.п.). Эти данные хранятся в самом документе или генерятся на лету средствами винды?

_TrachinuS_
30.05.2008, 13:29
Хороший вопрос... Думаю что на лету все происходит.
У оффиса все доки храняться как XML' ные файлы.

Timur Naimov
30.05.2008, 13:37
Хороший вопрос... Думаю что на лету все происходит.
У оффиса все доки храняться как XML' ные файлы.
Как раз наоборот. В XML'ле файлы хранит только 2007-й офис. Вот что я там нашел:
<?xml version="1.0" encoding="UTF-8" standalone="yes" ?>
- <Properties xmlns="http://schemas.openxmlformats.org/officeDocument/2006/extended-properties" xmlns:vt="http://schemas.openxmlformats.org/officeDocument/2006/docPropsVTypes">
<Template>Normal</Template>
<TotalTime>9</TotalTime>
<Pages>1</Pages>
<Words>160</Words>
<Characters>912</Characters>
<Application>Microsoft Office Word</Application>
<DocSecurity>0</DocSecurity>
<Lines>7</Lines>
<Paragraphs>2</Paragraphs>
<ScaleCrop>false</ScaleCrop>
<Company>.</Company>
<LinksUpToDate>false</LinksUpToDate>
<CharactersWithSpaces>1070</CharactersWithSpaces>
<SharedDoc>false</SharedDoc>
<HyperlinksChanged>false</HyperlinksChanged>
<AppVersion>12.0000</AppVersion>
</Properties>

Так что у 2007-го статистика документа не вычисляется на лету, а хранится в метаданных.
У более ранних версий скорее всего тоже - но не в XML'ле конечно а как часть файла.

Timur Salikhov
30.05.2008, 13:39
Хороший вопрос... Думаю что на лету все происходит.
У оффиса все доки храняться как XML' ные файлы.

Странно... винда показывает 85 слов 480 знаков, сам ворд 80 слов 474 знака :))))

В более весомом документе расхождения еще круче 45244 слова против 36633.

_TrachinuS_
30.05.2008, 13:42
Вот и я о том же :) У меня всегда по разному показывает и винда и ворд :)))

Timur Salikhov
30.05.2008, 13:46
Вот и я о том же :) У меня всегда по разному показывает и винда и ворд :)))

Причем ошибается винда... в документе

Раз два три четыре пять шесть семь восемь девять десять
насчитала всего 8 слов.

_TrachinuS_
30.05.2008, 14:09
1 Timur Salikhov
Из этого вытекает что все на лету...:blink:
А зачем тада мета инфо :to_babruysk: