На главную страницу AlgoNet В сотрудничестве с ZDNet
АРХИВ СТАТЕЙ 2005-10-26 на главную / новости от 2005-10-26
AlgoNet.ru
поиск

 

Место для Вашей рекламы!

 

Все новости от 26 октября 2005 г.

Microsoft предложит поиск по книгам

На фоне судебных исков против Google компания Microsoft сообщила, что она присоединится к конкурирующему и менее спорному проекту перевода в цифровую форму библиотечных книг, спонсируемому Yahoo и Internet Archive.

«Сейчас трудное время, учитывая возникшие проблемы с авторскими правами», — сказала генеральный менеджер MSN по приобретению поискового контента Даниэла Тидт. Против Google ведется два процесса по обвинению в нарушении авторских прав при сканировании и оцифровке полных библиотечных собраний таких университетов, как Гарвард, Стэнфорд, Оксфорд и Мичиганский университет, а также Нью-Йоркской публичной библиотеки. В сентябре в суд подала Авторская гильдия, а на прошлой неделе — Ассоциация американских издателей. Google говорит, что из книг, защищенных авторскими правами, она будет выкладывать лишь по несколько фраз, пока автор не разрешит открыть остальное. Однако истцы утверждают, что полное сканирование книг уже нарушает закон об авторском праве.

Чтобы избежать подобных проблем, проект Yahoo-Internet Archive, воплощаемый организацией Open Content Alliance, будет оцифровывать только те тексты, которые являются всеобщим достоянием, а также книги, на которые получено явное разрешение от владельца авторских прав. Кроме того, проект индексирует оцифрованные книги так, чтобы их можно было искать через веб, в отличие от Google, которая оцифровывает книги только для собственной поисковой машины.

«Наша принципиальная и философская позиция совпадает с идеей, что интеллектуальная собственность не должна принадлежать ни одной коммерческой компании», — сказала Тидт.

По ее словам, Microsoft готова за первый год оплатить оцифровку 150 тыс. книг, что обойдется примерно в $5 млн, исходя из стоимости работы около 10 центов за страницу и среднего объема книги в 300 страниц. Yahoo пообещала оплатить оцифровку 18 тыс. книг.

Оцифровывать материалы будет некоммерческая организация Internet Archive, созданная для предоставления доступа к историческим коллекциям, существующим в цифровом формате. В будущем году Microsoft откроет службу MSN Book Search и станет экспериментировать с разными бизнес-моделями, такими как постраничная оплата, месячная подписка, продажа электронных книг и реклама. «Бизнес-модель будет меняться в зависимости от того, защищена ли книга авторскими правами», — сказала Тидт.

MSN предложит не только простой доступ к книгам. Например, компания может предложить такие услуги, как предоставление читателям возможности аннотировать книги, создавать дискуссионные группы и копировать текст в офисные приложения. Не исключено, что Microsoft и Yahoo будут обмениваться оцифрованными книгами. «Мы работаем над глобальной коллекцией», — сказала Тидт. 

 Предыдущие публикации:
2005-10-03   Yahoo займется оцифровкой книг, не защищенных авторскими правами
2005-10-03   EC берется за создание собственной цифровой библиотеки
2005-10-19   Google осваивает европейскую литературу
 В продолжение темы:
2006-08-31   Google: «Вот вам бесплатные книги»
Обсуждение и комментарии
vIv - itgooroogmail.com
26 Oct 2005 1:34 PM
Кроме того, проект индексирует оцифрованные книги так, чтобы их можно было искать через веб, в отличие от Google, которая оцифровывает книги только для собственной поисковой машины.
----

Кому-то Гугля не завезли, как я понимаю? :-)
 

vIv - itgooroogmail.com
26 Oct 2005 1:45 PM
2500 баксов за 8-часовой рабочий день с одного сканера.
Где записываются в очередь? У меня свой сканер даже есть :-))
 

M&M's
26 Oct 2005 2:44 PM
Yahoo'ею. "Мы работаем над глобальной концепцией". Ну ну, концептуалисты, только кнопочки не забудьте покрасивее прорисовать :-)
 

M&M's
26 Oct 2005 2:49 PM
2 vlv:
своего сканера мало, нужет еще файнридер и фотошоп, а также корректоры и дизайнеры, для сверки распознаного текста и ретуши фотографий.
 

M&M's
26 Oct 2005 3:06 PM
Если хорошо отработать процесс, и выйти на производительность порядка 100 страниц в час, то это получается $0.1 x 100 x 8 x 22 = $1760 в месяц на команду из двух-трех человек.
 

Wintermute - devnul.ru
26 Oct 2005 4:00 PM
2 M&M's: Самое главное - корректоры, причем такие, которые знают целевой литературный язык. И деньги им платить за то, чтобы вычитывали.
 

Chkaloff
26 Oct 2005 7:33 PM
M&M's, еще нужно первоночальный материал для сканирования, который тоже денег стоит и раздирать скнигу на страницы аккуратно, тоже процесс.

vlv гонит
 

M&M's
26 Oct 2005 9:34 PM
2 Chkaloff:
> и раздирать скнигу на страницы аккуратно...
Это какой же архив позволит раздирать свои книги на страницы, даже если это необходимо? Для сканирования, кстати, не необходимо. Так что решайте сами, кто из вас двоих сегодня не выспался :-)
 

Wintermute - devnul.ru
26 Oct 2005 9:49 PM
2 Chkaloff: "раздирать скнигу на страницы аккуратно, тоже процесс"
Варвар!
Есть специальные сканеры, которыми старинные фолианты оцифровывают. По сути, это цифровые камеры высокого разрешения, снимающие с большими выдержками (на многие старые книги нельзя ярко светить) плюс софт, "выравнивающий" поверхность страницы. Стоят они невдолбенных денег и работают медленно. Но качественно.
Насколько мне известно, два таких сканера установлено в ленинке.
 

torvic
27 Oct 2005 12:46 AM
Показывали тут недавно (по Евроньюз, по-моему) гуглевский сканер. Больше на комбайн похоже, процесс полностью автоматизирован, даже страницы сам листает.
 

Chkaloff
27 Oct 2005 12:58 PM
2 Wintermute:
Речи идет о себестоимости. Тот пример, которые вы привели, себестоимость одной страницы никак не снизит. Даже если нет процесса раздирания книг.
 

сканер
27 Oct 2005 2:56 PM
Если хорошо отработать процесс, и выйти на производительность порядка 100 страниц в час
==
ну насмешил :)) Сейчас передомной стоит сканер, за 25 тыс. баксов, если я не ошибаюсь у него норма 800 тыс. страниц за 8 часов работы. НО, для этого сканера книги нужно расшивать.
 

M&M's
27 Oct 2005 5:39 PM
Исчо раз павтаряйу, сканирававть - атцтой, тут и негр из Бабруйска справицца. Слажнее распазнавать текст, и патом правирять ево - а то палучицца низачот, типа текста каторый афффтар напесал.
 

torvic
27 Oct 2005 10:27 PM
Нафик его проверять-то?
Для индексации и сгенерённый сойдёт.
 

злой
28 Oct 2005 11:28 AM
2M&M's
Исчо раз павтаряйу, сканирававть - атцтой...
==

вобщето, как отсканируешь, так и распознаешь :) Так что, процес сканирования, самый важный процес.
 

 

← сентябрь 2005 21  23  24  25  26  27  28  30  31 ноябрь 2005 →
Реклама!
 

 

Место для Вашей рекламы!