Моё меню Общее меню Сообщество Правила форума Все прочитано
Вернуться   uForum.uz > ИКТ и телеком > Веб-ресурсы и доменные имена > Каталоги и поисковики > WWW.UZ
Сообщения за день Поиск
Знаете ли Вы, что ...
...инструкция по установке аватара описана в Правилах форума.
<< Предыдущий совет - Случайный совет - Следующий совет >>

WWW.UZ Национальная информационно-поисковая система WWW.UZ. Раздел UZINFOCOM


Ответить

 
Опции темы Опции просмотра
Старый 15.06.2009 00:10   #11  
Real ID Group Ultimate uParty Member ЕС
Аватар для Evgeniy Sklyarevskiy
Оффлайн
UZINFOCOM
Сотрудник ZiyoNET
AKA:ЕС, barbaris, arbuz
Сообщений: 32,709
+ 10,568  16,236/8,377
– 50  472/298

UzbekistanLiveJournalАккаунт на TwitterFacebook
Цитата:
Сообщение от Djalolatdin Rakhimov Посмотреть сообщение
Цитата:
Сообщение от Evgeniy Sklyarevskiy Посмотреть сообщение
Цитата:
Сообщение от Djalolatdin Rakhimov Посмотреть сообщение
В статистике хостов мы считает именно хосты, а не пользователей.
А через какое минимальное время повторный заход с тем же IP плюсуется как новый хост?
Или это закрытая информация для избежания накруток?
С начала новых суток отсчет начинается заново.
Спасибо за ответ. Наверное, любой выбранный интервал имел бы свои плюсы и минусы. Тут самое главное, что у всех участников считается по одному алгоритму, поэтому соревнование честное.

Ну, можно только выдумать ситуацию, что у какого-то сайта все посетители диалапшики с частыми разрывам, и один и тот же человек заходит с разным ИП, а у другого сайте все посетители корпоративщики и заходят под ИП своей сети. Но вряд ли такое деление имеет место, в среднем у всех должно быть одинаково.
Ответить 
Старый 15.06.2009 01:05   #12  
Real ID Group uParty Member Ultimate
Аватар для Djalolatdin Rakhimov
Оффлайн
AKA:dj
Сообщений: 23,604
+ 8,711  10,751/5,416
– 62  55/49

UzbekistanОтправить сообщение для Djalolatdin Rakhimov с помощью Skype™Аккаунт на Twitter
Цитата:
Сообщение от Evgeniy Sklyarevskiy Посмотреть сообщение
Ну, можно только выдумать ситуацию, что у какого-то сайта все посетители диалапшики с частыми разрывам, и один и тот же человек заходит с разным ИП, а у другого сайте все посетители корпоративщики и заходят под ИП своей сети. Но вряд ли такое деление имеет место, в среднем у всех должно быть одинаково.
Опять же: мы можем считать только ip-адреса, а никак не конкретных пользователей.
Ответить 
Старый 15.06.2009 17:59   #13  
Real ID Group
Аватар для Ilkhom Idiyev
Оффлайн
AKA:IDv
Сообщений: 335
+ 34  96/58
– 4  2/2

Uzbekistan
Цитата:
Сообщение от Djalolatdin Rakhimov Посмотреть сообщение
Я и говорю, повторяясь: Если у Вас есть реальный механизм определения количества пользователей, то просто рады будем реализовать его. Даже заплачу.
думаю, этот механизм не сложен, и все сервисы статистика используют его.

Считаем посетителей.
* Генерируем большое случайное число. Заносим его в куки браузера сроком до конца текущего дня (23:59). Важно при установки куки указать домен без www и корневую директории '/'.


Думаю, у вас в БД имеется таблица с хитами, имеющая примерно такие поля:
id | siteId | time | url | ip | userAgent
добавим еще одно поле
id | siteId | time | url | ip | userAgent | visitorId

visitorId - это и есть то случайное число, которые мы занесли в куки.
Каждый показ страницы мы добавляем запись в эту таблицу. Если в куки пользователя установлена visitorId , то заносим это значение, если нет - то генерируем новое, заносим в таблицу и сохраняем в куки (см "*").
Теперь можно спокойно подсчитать посетителей - количество уникальных значений visitorId.

Система против накруток.
Во-первых, если у пользователя отключены куки, то не считаем его за посетителя, т.к. это скорее всего бот. Над этим еще нужно подумать, потому что некоторые отключают куки. Можно, к примеру их тоже считать за посетителей по уникальности ip+userAgent, отбрасывая при этом поисковых ботов.

Понимаю, обойти такую систему легко, достаточно отчищать куки и обновлять страницу, тогда система будет считать вас за нового посетителя. Но и идентифицировать накрутчиков достаточно легко:
1. Накрутчик скорее всего владелец сайта (или один из владельцев).
2. Накрутчик скорее всего не будет менять userAgent и ip.

Исходя и 1 и 2 можно построить такую систему:
1. Сохраняем ip зарегистрировавшего сайт в каталоге и всех, кто смотрит статистику (посещает страницу http://www.uz/catalogue/toprating/topid/{siteId} )
2. Извлекать записи из таблицы с хитами, у которых одинаковые ip и userAgent, но разные visitorId за день. Если таких записей больше n и временные промежутки между созданием записи - t, то это накрутка. Если ip этих записей равно хотя бы одному ip из пункта 1, то это однозначно накрутчик.

Если хорошо продумать значения n и t, то можно вычислять процент вероятности накрутки. Если еще немного поразмышлять и добавить в систему новые параметры вероятности можно довести все до автоматики (скажем, автоматически удалять потенциальные накрутки с вероятностью > 80%).

PS: написал на скорую руку, особо не продумывая. Если ваши специалисты хорошенько поразмышляют, проведут исследования и проанализирует существующую статистику, то можно создать достаточно качественный и точный инструмент.

Последний раз редактировалось Ilkhom Idiyev; 15.06.2009 в 18:29.
Ответить 
Старый 15.06.2009 18:12   #14  
Real ID Group
Аватар для Ilkhom Idiyev
Оффлайн
AKA:IDv
Сообщений: 335
+ 34  96/58
– 4  2/2

Uzbekistan
информация для размышления (http://www.liveinternet.ru/help/stat/mismatches.html) :
Цитата:
Посетители:

LiveInternet - уникальный посетитель определяется по выдаваемой браузеру
специальной метке (cookie). Если браузер не принимает cookies,
то в учете посетителей он не участвует, от такого браузера
будут засчитываться только просмотры (и переходы).

В RamblerTop100 посетители определяются так же по cookies, но в
том случае, если браузер не принимает cookies, то посетитель
тоже считается, но уже по IP-адресу; в общем, при прочих равных
условиях "посетителей" по Rambler будет немного больше, чем по
LiveInternet. В отчете "Подробная статистика" Rambler выводит такой
показатель "В том числе посетителей с cookie", вот как раз это
значение и должно совпадать с количеством посетителей по LiveInternet.

TopMail ведет учет посетителей так же, как и LiveInternet - по cookies,
если браузер не принимает cookie, то он как посетитель не учитывается.
(Обратите внимание, что это нововведение TopMail, раньше TopMail не вел
учет посетителей по cookies)

SpyLOG ведет учет посетителей приблизительно так же, как и
RamblerTop100: тоже по cookies, но с какими-то дополнительными
ухищрениями в случае отсутствия в браузере поддержки cookies;
то есть посетителей по SpyLOG должно показываться больше, чем
по LiveInternet.

Hotlog, вероятно, называет посетителями то же, что и LiveInternet. К
сожалению, точного определения на сайте Hotlog нет.

Последний раз редактировалось Ilkhom Idiyev; 15.06.2009 в 18:14.
Ответить 
Реклама и уведомления
Старый 16.06.2009 15:06   #15  
Real ID Group uParty Member Ultimate
Аватар для Djalolatdin Rakhimov
Оффлайн
AKA:dj
Сообщений: 23,604
+ 8,711  10,751/5,416
– 62  55/49

UzbekistanОтправить сообщение для Djalolatdin Rakhimov с помощью Skype™Аккаунт на Twitter
Цитата:
Сообщение от Ильхом Посмотреть сообщение
PS: написал на скорую руку, особо не продумывая. Если ваши специалисты хорошенько поразмышляют, проведут исследования и проанализирует существующую статистику, то можно создать достаточно качественный и точный инструмент.
Ильхом, спасибо. Я попрошу наших специалистов прокомментировать Ваше предложение.
Ответить 
Старый 16.06.2009 16:47   #16  
Аватар для Ruslan Aliev
Оффлайн
AKA:Рустамыч
Сообщений: 2,598
+ 475  792/462
– 45  44/28

KazakhstanОтправить сообщение для Ruslan Aliev с помощью Skype™Мой КругАккаунт на Twitter
Цитата:
Сообщение от Ильхом Посмотреть сообщение
Цитата:
Сообщение от Djalolatdin Rakhimov Посмотреть сообщение
Я и говорю, повторяясь: Если у Вас есть реальный механизм определения количества пользователей, то просто рады будем реализовать его. Даже заплачу.
думаю, этот механизм не сложен, и все сервисы статистика используют его.

Считаем посетителей.
* Генерируем большое случайное число. Заносим его в куки браузера сроком до конца текущего дня (23:59). Важно при установки куки указать домен без www и корневую директории '/'.


Думаю, у вас в БД имеется таблица с хитами, имеющая примерно такие поля:
id | siteId | time | url | ip | userAgent
добавим еще одно поле
id | siteId | time | url | ip | userAgent | visitorId

visitorId - это и есть то случайное число, которые мы занесли в куки.
Каждый показ страницы мы добавляем запись в эту таблицу. Если в куки пользователя установлена visitorId , то заносим это значение, если нет - то генерируем новое, заносим в таблицу и сохраняем в куки (см "*").
Теперь можно спокойно подсчитать посетителей - количество уникальных значений visitorId.
Да это понятно. Примерно так и делаем.
Цитата:
Сообщение от Ильхом Посмотреть сообщение

Система против накруток.
Во-первых, если у пользователя отключены куки, то не считаем его за посетителя, т.к. это скорее всего бот. Над этим еще нужно подумать, потому что некоторые отключают куки. Можно, к примеру их тоже считать за посетителей по уникальности ip+userAgent, отбрасывая при этом поисковых ботов.
А если добавить еще и разрешение монитора и версию javascript то можно даже сделать точнее. Другое ело что все эти параметры можно менять и подделывать.
Цитата:
Сообщение от Ильхом Посмотреть сообщение
Понимаю, обойти такую систему легко, достаточно отчищать куки и обновлять страницу, тогда система будет считать вас за нового посетителя. Но и идентифицировать накрутчиков достаточно легко:
1. Накрутчик скорее всего владелец сайта (или один из владельцев).
2. Накрутчик скорее всего не будет менять userAgent и ip.
Исходя их моего опыта, владельцы узбекских сайтов использующие накрутки, делают это умело и профессионально. Скорее всего будет использваться специальная система, услуги которой будут оплачены.
Цитата:
Сообщение от Ильхом Посмотреть сообщение

Исходя и 1 и 2 можно построить такую систему:
1. Сохраняем ip зарегистрировавшего сайт в каталоге и всех, кто смотрит статистику (посещает страницу http://www.uz/catalogue/toprating/topid/{siteId} )
2. Извлекать записи из таблицы с хитами, у которых одинаковые ip и userAgent, но разные visitorId за день. Если таких записей больше n и временные промежутки между созданием записи - t, то это накрутка. Если ip этих записей равно хотя бы одному ip из пункта 1, то это однозначно накрутчик.

Если хорошо продумать значения n и t, то можно вычислять процент вероятности накрутки. Если еще немного поразмышлять и добавить в систему новые параметры вероятности можно довести все до автоматики (скажем, автоматически удалять потенциальные накрутки с вероятностью > 80%).
В том то и дело, что когда речь идет о вероятностях то доверять этому уже как то трудно.
Цитата:
Сообщение от Ильхом Посмотреть сообщение

PS: написал на скорую руку, особо не продумывая. Если ваши специалисты хорошенько поразмышляют, проведут исследования и проанализирует существующую статистику, то можно создать достаточно качественный и точный инструмент.
Ильхом спасибо. Единственное что могу сказать что об этом думали и пока не нашли 100% способа определить количество пользователей.
Тот способ, который вы предлагаете, требует переделки существующей ситсемы. Это огромный объем работ. Особенно если учесть, что нужно сделать плавный переход от одной системы (без учета кук) к другой (с учетом). Можно учитывать количество "пользователей" и на существующей системы (скажем пользователь это IP + UserAgent) - но это легко подделывается.

Ко всему выше сказанному могу добавить, что уже запланировано создание новой системы, где будут учитываться "пользователи". Сроки сказать не могу.
__________________
Свет рождает тени ...

Последний раз редактировалось Ruslan Aliev; 16.06.2009 в 16:49.
Ответить 
Старый 16.06.2009 22:23   #17  
Real ID Group
Аватар для Ilkhom Idiyev
Оффлайн
AKA:IDv
Сообщений: 335
+ 34  96/58
– 4  2/2

Uzbekistan
все ясно. Будем ждать тогда новой системы .

Еще хотелось бы сказать, не нужно слишком заморачиваться с проблемой накрутки, переходящей в паранойю. Накрутить можно все и везде, главное желание. Не думаю, что аналогичные западные и европейские сервисы используют супер-навороченную систему от накруток. Тут все зависит от уровня интеллекта самих пользователей. Просто сами посетители должны понять, что это не нужное дело, от него ровным счетом никакой пользы. Хороший сайт итак будут посещать, без каких либо мест в топах. А у ненужного и некачественного сайта, будь он в самых верхах топов какое-то время, все равно не вырастет посещаемость, возможно лишь на какой-то маленький период и только..
Ответить 
Старый 16.06.2009 22:44   #18  
Real ID Group Ultimate uParty Member ЕС
Аватар для Evgeniy Sklyarevskiy
Оффлайн
UZINFOCOM
Сотрудник ZiyoNET
AKA:ЕС, barbaris, arbuz
Сообщений: 32,709
+ 10,568  16,236/8,377
– 50  472/298

UzbekistanLiveJournalАккаунт на TwitterFacebook
Цитата:
Сообщение от Ильхом Посмотреть сообщение
Хороший сайт итак будут посещать, без каких либо мест в топах. А у ненужного и некачественного сайта, будь он в самых верхах топов какое-то время, все равно не вырастет посещаемость, возможно лишь на какой-то маленький период и только..
А посетители и не ориентируются на счетчики — это больше для рекламодателей (и то, недалеких), которым можно проехать по ушам и завысить цену, показав большие цифры. Когда к нам придет цивилизация, то рекламщики будут платить не за показы (посещения), а ориентируясь на ТИЦ или PR, которые в тыщи раз труднее накрутить чем посещения. Ну, или если за показы, как SIR, то по своим данным, не взирая на сторонние счетчики.
Надо относиться к ним как к пузомерке-развлекухе...
Ответить 
Старый 17.06.2009 21:31   #19  
Real ID Group
Аватар для Ilkhom Idiyev
Оффлайн
AKA:IDv
Сообщений: 335
+ 34  96/58
– 4  2/2

Uzbekistan
Я хотел сказать не посетители, а создатели сайтов ))
Ответить 
Старый 19.06.2009 09:15   #20  
Аватар для Ruslan Aliev
Оффлайн
AKA:Рустамыч
Сообщений: 2,598
+ 475  792/462
– 45  44/28

KazakhstanОтправить сообщение для Ruslan Aliev с помощью Skype™Мой КругАккаунт на Twitter
Talking

Цитата:
Сообщение от Ильхом Посмотреть сообщение
Я хотел сказать не посетители, а создатели сайтов ))
А ЕС и есть создатель многих сайтов, теперь понятно зачем он ставил наши счетчики.
__________________
Свет рождает тени ...
Ответить 
Ответить




Powered by vBulletin® Version 3.8.5
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd. Перевод: zCarot
Advertisement System V2.5 By Branden
OOO «Единый интегратор UZINFOCOM»


Новые 24 часа Кто на форуме Новички Поиск Кабинет Все прочитано Вверх