المساعد الشخصي الرقمي

مشاهدة النسخة كاملة : The Other Side of the Search Gods Abracadabra!

11-01-2013, بتوقيت غرينيتش 04:53 PM
The Other Side of the Search Gods Abracadabra!

Thousands of servers ...billions of web pages.... the possibility of individually sifting through the WWW is null. The search engine gods cull the information you need from the Internet...from tracking down an elusive expert for communication to presenting the most unconventional views on the planet. Name it and click it. Beyond all the hype created about the web heavens they rule, let's attempt to keep the argument balanced. From Google (http://www.google.com/) to Voice of the Shuttle (http://vos.ucsb.edu/index-netscape.asp) (for humanities research) these ubiquitous gods that enrich the net, can be unfair ...and do wear pitfalls. And considering the rate at which the Internet continues to grow, the problems of these gods are only exacerbated further.
Primarily, what you need to digest is the fact that search engines fall short of Mandrake's magic mechanism! They simply don't create URLs out of thin air but instead send their spiders crawling across those sites that have rendered prayers (and expensive offerings!) to them for consideration. Even when sites like Google (http://www.google.com/) claim to have a massive 3 billion web pages in its database, a large portion of the web nation is invisible to these spiders. To think they are simply ignorant of the Invisible Web. This invisible web holds that content, normal search engines can't index because the information on many web sites is in databases that are only searchable within that site. Sites like www.imdb.com (http://www.imdb.com/) - The Internet Movie Database , www.incywincy.com (http://www.incywincy.com/) - IncyWincy, the invisible web search engine and www.completeplanet.com (http://www.completeplanet.com/) - The Complete Planet that cover this area are perhaps the only way you can access content from that portion of the Internet, invisible to the search gods. Here, you don't perform a direct content search but search for the resources that may access the content. (Meaning - be sure to set aside considerable time for digging.)
None of the search engines indexes everything on the Web (I mean none). Tried research literature on popular search engines? AltaVista (http://altavista.com/) to Yahoo (http://yahoo.com/), will list thousands of sources on education, human resource development, etc. etc. but mostly from magazines, newspapers, and various organizations' own Web pages, rather than from research journals and dissertations- the main sources of research literature. That's because most of the journals and dissertations are not yet available publicly on the Web. Thought they'll get you all that's hosted on the web? Think again.
The Web is huge and growing exponentially. Simple searches, using a single word or phrase, will often yield thousands of "hits", most of which will be irrelevant. A layman going in for a piece of info to the internet has to deal with a more severe issue - too much information! And if you don't learn how to control the information overload from these websites, returned by a search result, roll out the red carpet for some frustration. A very common problem results from sites that have a lot of pages with similar content. For e.g., if a discussion thread (in a forum) goes on for a hundred posts there will be a hundred pages all with similar titles, each containing a wee bit of information. Now instead of just one link, all hundred of those darn pages will crop up your search result, crowding out other relevant site. Regardless of all the sophistication technology has brought in, many well thought-out search phrases produce list after list of irrelevant web pages. The typical search still requires sifting through dirt to find the gold. If you are not specific enough, you may get too many irrelevant hits.
As said, these search engines do not actually search the web directly but their centralized server instead. And unless this database is updated continually to index modified, moved, deleted or renamed documents, you will land yourself amidst broken links and stale copies of web pages. So if they inadequately handle dynamic web pages whose content changes frequently, chances are for the information they reference to quickly go out-of-date. After they wage their never ending war with over-zealous promoters (spamdexers rather), where do they have time to keep their databases current and their search algorithms tuned? No surprise if a perfectly worthwhile site may go unlisted!
Similarly, many of the Web search engines are undergoing rapid development and are not well documented. You will have only an approximate idea of how they are working, and unknown shortcomings may cause them to miss desired information. Not to mention, amongst the first class information, the web also houses false, misleading, deceptive and dressed up information actually produced by charlatans. The Web itself is unstable and tomorrow they may not find you the site they found you today. Well if you could predict them, they would not be god!...would they?! The syntax (word order and punctuation) for various types of complex searches varies some from search engine to search engine, and small errors in the syntax can seriously compromise the search. For instance, try the same phrase search on different search engines and you'll know what I mean. Novices... read this line - using search engines does involve a learning curve. Many beginning Internet users, because of these disadvantages, become discouraged and frustrated.

Like a journalist put it, "Not showing favoritism to its business clients is certainly a rare virtue in these times." Search engines have increasingly turned to two significant revenue streams. Paid placement: In addition to the main editorial-driven search results, the search engines display a second - and sometimes third - listing that's usually commercial in nature. The more you pay, the higher you'll appear in the search results. Paid inclusion: An advertiser or content partner pays the search engine to crawl its site and include the results in the main editorial listing. So?...more likely to be in the hit list but then again - no guarantees. Of course those refusing to favor certain devotees are industry leaders like Google (http://www.google.com/) that publishes paid listings, but clearly marks them as 'Sponsored Links.'

The possibility of these 'for-profit' search gods (which haven't yet made much profit) for taking fees to skew their searches, can't be ruled out. But as a searcher, the hit list you are provided with by the engine should obviously rank in the order of relevancy and interest. Search command languages can often be complex and confusing and the ranking algorithm is unique to each god based on the number of occurrences of the search phrase in a page, if it appears in the page title, or in a heading, or the URL itself, or the meta tag (http://ntrg.cs.tcd.ie/undergrad/4ba2.02-03/p8.html#meta#meta) etc. or on a weighted average of a number of these relevance scores. E.g. Google (www.google.com) (http://www.google.com/) uses its patented PageRank TM and ranks the importance of search results by examining the links that lead to a specific site. The more links that lead to a site, the higher the site is ranked. Pop on popularity!
Alta Vista (http://www.altavista.digital.com/), HotBot (http://www.hotbot.com/), Lycos (http://www.lycos.com/), Infoseek and MSN Search (http://search.msn.com/) use keyword indexes - fast access to millions of documents. The lack of an index structure and poor accuracy of the size of the WWW, will not make searching any easier. Large number of sites indexed. Keyword searching can be difficult to get right.
In reality, however, the prevalence of a certain keyword is not always in proportion to the relevance of a page. Take this example. A search on sari - the national costume of India -in a popular search engine, returned among it's top sites, the following links:
?www.scri.sari.ac.uk/ (http://www.scri.sari.ac.uk/)- of the Scottish Crop research Institute
?www.ubudsari.com/ (http://www.ubudsari.com/) -a health resort in Indonesia
?www.sari-energy.org/ (http://www.sari-energy.org/) - The South Asia Regional Initiative for Energy Cooperation and Development

Pretty useful sites for someone very much interested in knowing how to drape or the tradition of the sari?! (Well, no prayer goes unanswered...whether you like the answer or not!) By using keywords to determine how each page will be ranked in search results and not simply counting the number of instances of a word on a page, search engines are attempting to make the rankings better by assigning more weight to things like titles, subheadings, and so on.
Now, unless you have a clear ideaof what you're looking for, it may be difficult or impossible to use a keyword search, especially if the vocabulary of the subject is unfamiliar. Similarly, the concept based search of Excite (instead of individual words, the words that you enter into a search are grouped and attempted to determine the meaning) is a difficult task and yields inconsistent results.

Besides who reviews or evaluates these sites for quality or authority? They are simply compiled by a computer program.These active search engines rely on computerized retrieval mechanisms called "spiders", "crawlers", or "robots", to visit Web sites, on a regular basis and retrieve relevant keywords to index and store in a searchable database. And from this huge database yields often unmanageable and comprehensive results....results whose relevance is determined by their computers. The irrelevant sites (high percentage of noise, as it's called), questionable ranking mechanisms and poor quality control may be the result of less human involvement to weed out junk. Thought human intervention would solve all probes....read on.
From the very first search engine - Yahoo to about.com, Snap.com, Magellan, NetGuide, Go Network, LookSmart (http://www.looksmart.com/), NBCi (http://nbci.msnbc.com/nbci.asp) and Starting Point, all subject directories index and review documents under categories - making them more manageable. Unlike active search engines, these passive or human-selected search engines like don't roam the web directly and are human controlled, relying on individual submissions. Perhaps the easiest to use in town, but the indexing structure these search engines cover only a small portion of the actual number of WWW sites and thus is certainly not your bet if you intend specific, narrow or complex topics.

Subject designations may be arbitrary, confusing or wrong. A search looks for matches only in the descriptions submitted. Never contains full text of the web they link to - you can only search what you see titles, descriptions, subject categories, etc. Human-labor intensive process limits database currency, size, rate of growth and timeliness. You may have to branch through the categories repeatedly before arriving at the right page. They may be several months behind the times because of the need for human organization. Try looking for some obscure topic....chances for the people that maintain the directory to have excluded those pages. Obviously, machines can blindly count keywords but they can't make common-sense judgement as humans can. But then why does human-edited directories respond with all this junk?!
And here's about those meta search engines. A comprehensive search on the entire WWW usingThe Big Hub (http://www.thebighub.com/), Dogpile (http://www.dogpile.com/), Highway61 (http://www.highway61.com/), Internet Sleuth (http://www.isleuth.com/) or Savvysearch (http://www.savvysearch.com/) , covering as many documents as possible may sound as good an idea as a one stop shopping.Meta search engines do not create their own databases. They rely on existing active and passive search engine indexes to retrieve search results. And the very fact that they access multiple keyword indexes reduces their response time. It sure does save your time by searching several search engines at once but at the expense of redundant, unwanted and overwhelming results....much more - important misses. The default search mode differs from search site to search site, so the same search is not always appropriate in different search engine software. The quality and size of the databases vary widely.
Weighted Search Engines like Ask Jeeves (http://askjeeves.com/) and RagingSearch (http://www.ragingsearch.com/) allows the user to type queries in plain English without advanced searching knowledge, again at the expense of inaccurate and undetailed searching. Review or Ranking Sources like Argus Clearinghouse (www.clearinghouse.net),
(http://www.clearinghouse.net/)eBlast (eblast.com) (http://eblast.com/) and Librarian's Index to the Internet (lii.org) (http://lii.org/). They evaluate website quality from sources they find or accept submissions from but cover a minimal number of sites.

As a webmaster, your site registration with the biggest billboards in Times Square can get you closer to bingo! for the searcher. Those who didn't even know you existed before are in your living room in New York time!

Your URL registration is a no-brainer, considering the generation of flocking traffic to your site. Certainly a quick and inexpensive method, yet is only a component of the overall marketing strategy that in itself offers no guarantees, no instant results and demands continued effort for the webmaster. Commerce rules the web. Like how a notable Internet caveman put it, "Web publishers also find dealing with search engines to be a frustrating pursuit. Everybody wants their pages to be easy for the world to find, but getting your site listed can be tough. Search sites may take a long time to list your site, may never list it at all, and may drop it after a few months for no reason. If you resubmit often, as it is very tempting to do, you may even be branded a spamdexer and barred from a search site. And as for trying to get a good ranking, forget it! You have to keep up with all the arcane and ever-changing rules of a dozen different search engines, and adjust the keywords on your pages just so...all the while fighting against the very plausible theory that in fact none of this stuff matters, and the search sites assign rankings at random or by whim.
"To make the best use of Web search engines--to find what you need and avoid an avalanche of irrelevant hits-- pick search engines that are well suited to your needs. And lest you'd want to cry "Ye immortal gods! where in the world are we?", spend a few hours becoming moderately proficient with each. Each works somewhat differently, most importantly in respect to how you broaden or narrow a search.
Finding the appropriate search engine for your particular information need, can be frustrating. To effectively use these search engines, it is important to understand what they are, how they work, and how they differ. For e.g. while using a meta search engine, remember that each engine has its own methods of displaying and ranking results. Remember, search strategies affect the results. If the user is unaware of basic search strategies, results may be spotty.
Quoting Charlie Morris (the former editor of The Web developer's journal) - "Search engines and directories survive, and indeed flourish, because they're all we've got. If you want to use the wealth of information that is the Web, you've got to be able to find what you want, and search engines and directories are the only way to do that. Getting good search results is a matter of chance. Depending on what you're searching for, you may get a meaty list of good resources, or you may get page after page of irrelevant drivel. By laboriously refining your search, and using several different search engines and directories (and especially by using appropriate specialty directories), you can usually find what you need in the end."
Search engines are very useful, no doubt. Right from getting a quick view of a topic to finding expert contact info...verily certain issues lie in their lap. Now the very reason we bother about these search engines so much is because they're all we've got! Though there sure is a lot of room for improvement, the hour's need is to not get caught in the middle of the road. By simply understanding what, how and where to seek, you'd spare yourself the fate of chanting that old Jewish proverb "If God lived on earth, people would break his windows."
Happy searching!
Liji is a PostGraduate in Software Science, with a flair for writing on anything under the sun. She puts her dexterity to work, writing technical articles in her areas of interest which include Internet programming, web design and development, ecommerce and other related issues.

منقول من هنا

الجانب الآخر لتَمْتَمةِ آلهةِ البحثَ!

ترجمة الى العربية
آلاف الخادماتِ. . . بلايين صفحاتِ الويب. . . . إنّ إمكانيةَ بشكل منفرد تَدقيق في دبليو دبليو دبليو ملغيةُ. تَذْبحُ آلهةُ ماكنةَ البحث المعلوماتَ تَحتاجُ مِنْ الإنترنتِ. . . مِنْ تَعْقيب خبيرَ مراوغَ للإتصالِ إلى تَقديم الأكثر وجهاتِ النظر الغير مألوفةِ على الكوكبِ. سمّه وإنقرْه. ما بعد كُلّ الدعاية خَلقتْ حول سماواتِ الويبَ يَحْكمونَ، دعنا نُحاولُ إبْقاء الحجّةِ وَازنَّا. مِنْ Google إلى صوت المكوكِ (لبحثِ العلوم الانسانيةِ) هذه الآلهةِ الموجودة في كلّ مكانِ التي تَغني الشبكةَ، يُمكنُ أَنْ تَكُونَ غير عادلةَ. . . ويَلْبسُ المخاطرَ. ويَعتبرُ النسبةَ في أَيّ الإنترنتِ تُواصلُ نَمُو، مشاكل هذه الآلهةِ تُثيرُ أخرى فقط.
أولياً، الذي تَحتاجُ لهَضْم الحقيقة بأنّ تُخفقُ مكائنُ البحث في الوصول إلى آليةِ اللفّاحِ السحريةِ! هم ببساطة لا يَخْلقونَ يو آر إل إس خارج الهواءِ الرقيقِ لكن بدلاً مِن ذلك يُرسلُ عناكبَهم يَزْحفُ عبر تلك المواقعِ التي أعادتْ الصلاواتَ (وعروض غالي! ) إليهم للإعتبارِ. حتى عندما يُحدّدُ موقع مثل إدّعاءِ Google أَنْ يَكُونَ عِنْدَهُ a 3 هائل بليون صفحة ويب في قاعدةِ بياناتها , a جزء كبير مِنْ أمةِ الويبَ مخفيُ إلى هذه العناكبِ. لإعتِقاد هم ببساطة جهلة بالويبِ المخفيِ. يَصْدُّ هذا الويبِ المخفيِ بأنّ مكائنِ البحث الطبيعيةِ الراضيةِ لا تَستطيعُ الفَهْرَسَة لأن المعلوماتَ على العديد مِنْ مواقعِ الويب في قواعدِ البيانات التي قابلة للبحث فقط ضمن ذلك الموقعِ. يُحدّدُ موقع مثل www.imdb.com (http://www.imdb.com) - قاعدة بيانات الانترنت للأفلام، www.incywincy.com (http://www.incywincy.com) - IncyWincy، محرّك البحث عن مواقع الويبِ المخفيِ وwww.completeplanet.com (http://www.completeplanet.com) - الكوكب الكامل ذلك غطاءِ هذه المنطقةِ ربما الطريق الوحيد الذي أنت يُمْكِنُ أَنْ تَدْخلَ محتوى مِنْ ذلك جزءِ الإنترنتِ، مخفي إلى آلهةِ البحثَ. هنا، أنت لا تُؤدّي a يُوجّهُ بحثاً راضياً لكن يَبْحثَ عن المصادرِ الذي قَدْ يَدْخلُ المحتوى. (معنى - يَكُونُ متأكّداً لوَضْع جانباً وقتِ كبيرِ للحَفْر. )
لا كُلّ شيءِ أدلةِ مكائنِ البحث على الشبكة (أَعْني لا شيئ). أدب البحثِ المُجرّبِ على مكائنِ البحث الشعبيةِ؟ الألتافيستا إلى الياهوو، سَيُدرجُ آلافَ المصادرِ على التعليمِ، تطوير مورد بشري، الخ. الخ. لكن في الغالب مِنْ المجلاتِ، صُحُف، وصفحات ويب منظماتِ مُخْتَلِفةِ الخاصةِ، بدلاً مِنْ المجلاتِ وإطروحاتِ البحثِ، المصادر الرئيسية لأدبِ البحثِ. تلك لأن أغلب المجلاتِ والإطروحاتِ لَيستا متوفرةَ رغم ذلك علناً على الشبكة. فكّرتَمْ هم هَلْ يَحْصلُ على أنتم جميعاً ذلك مُسْتَضْافونُ على الشبكة؟ يَعتقدُ ثانيةً.
إنّ الويبَ ضخمُ ومُتزايدُ تصاعدياً. عمليات البحث البسيطة، إستعمال a كلمة أعزبِ أَو عبارةِ، سَيُنتجُ آلافَ في أغلب الأحيان "الضرباتِ"، التي أغلبها سَتَكُونُ غير ذات علاقة. أي دُخُول رجل غير متخصّصِ لa قطعة المعلوماتِ إلى الإنترنتِ يَجِبُ أَنْ تَتعاملَ مع a قضية حادّة أكثر - كثيراً معلومات! وإذا أنت لا تَتعلّمُ كَيفَ تُسيطرُ على حمل المعلوماتَ الزائدِ مِنْ هذه مواقعِ الويب، عُدتَ مِن قِبل a نتيجة بحثِ، يَمْنحُ الإحترام الكامل لبَعْض الإحباطِ. أي مشكلة مشتركة جداً تَنْتجُ مِنْ المواقعِ التي لَها الكثير مِنْ الصفحاتِ بالمحتوى المماثلِ. لومثال على ذلكِ: -، إذا a خيط مُناقشةِ (في a منتدى) يَستمرُّ لa مائة منصب سيكون هناك a مائة صفحة كُلّ بالعناوينِ المماثلةِ، كُلّ إحتِواء a يَتبوّلُ قطعةَ المعلوماتِ. الآن بدلاً مِنْ فقط وصلة واحدة، كُلّ مائة مِنْ أولئك يُرتّقُ الصفحاتَ سَتَظْهرُ نتيجةَ بحثِكِ، يُخرجُ موقعَ ذو العلاقةَ آخرَ. بغض النظر عن كُلّ تقنية التطوّرَ جَلبتْ، حَلَّ الكثيرَ عباراتِ البحثَ حَسناً يُنتجونَ قائمةً بعد قائمةِ صفحاتِ الويب غير ذات علاقةِ. البحث المثالي ما زالَ يَتطلّبُ تَدقيق في الوسخِ لإيجاد الذهبِ. إذا أنت لَسْتَ معيّنَ بما فيه الكفاية، أنت قَدْ تَحْصلُ على الكثير مِنْ الضرباتِ غير ذات علاقةِ.
كما قِيلَ، هذه مكائنِ البحث لا تُفتّشُ الويبَ في الحقيقة مباشرة لكن خادمَهم المركزيَ بدلاً مِن ذلك. ومالم هذه قاعدةِ البيانات مُجَدَّدةُ بشكل مستمر لفَهْرَسَة الوثائقِ المُبَدَّلة إسمِ أو المَحْذُوفةِ أو المُتَحَرّكةِ أو المُعَدَّلةِ، أنت سَتُنزلُ نفسك وسط الصلاتِ المَكْسُورةِ والنسخِ الفاسدةِ مِنْ صفحاتِ الويب. إذن لو أنَّ يُعالجونَ صفحاتَ الويب متقدمة بشكل ناقص التي يَتغيّرُ محتوهم كثيراً، فرص للمعلوماتِ يُرجعونَ لذِهاب منتهي التأريخِ بسرعة. بَعْدَ أَنْ يَشْنّونَ هم مَا أنهوا حربَ مَع المروّجين المتحمّسينِ أكثر من اللازمِ (spamdexers بالأحرى)، أين هم لَهُم وقتُ لإبْقاء تيارِ قواعدِ بياناتهم وخوارزمياتِ بحثِهم يُنغّمَ؟ لا مفاجأةَ إذا a موقع نافع جداً قَدْ يَذْهبُ غير مُدرَج!
بنفس الطريقة، العديد مِنْ محرّكاتِ البحث عن مواقع الويبَ تَمْرُّ بتطويرِ سريعِ ولَيستْ موثّق بشكل جيدَ. أنت سَيكونُ عِنْدَكَ فقط فكرةَ تقريبيةَ كَمْ هم يَعْملونَ، وعيوب مجهولة قَدْ تَجْعلُهم للتَغَيُّب عن المعلوماتِ المطلوبةِ. بدون الحاجة لذكر، بين المعلوماتِ من الدرجة الأولى، يُسكنُ الويبَ معلوماتَ متأنّقةَ وخادعةَ ومُضَلِّلةَ وخاطئةَ أنتجتْ أيضاً في الحقيقة مِن قِبل النصابين. إنّ الويبَ بنفسه غير مستقرةُ وغداً هم قَدْ لا يَجِدونَك الموقعَ وَجدوك اليوم. حَسناً إذا أنت يُمْكِنُ أَنْ تَتوقّعَهم، هم لَنْ يَكُونوا إلهاً! . . . أليس كذلك؟ ! النحو (ترتيب كلمات وترقين) للأنواعِ المُخْتَلِفةِ مِنْ عملياتِ البحث المعقّدةِ تُغيّرُ البعضَ مِنْ ماكنةِ البحث إلى ماكنةِ البحث، وأخطاء صغيرة في النحو يُمْكِنُ أَنْ يُساومَ البحثَ بجدية. على سبيل المثال، يُحاولُ نفس بحثِ العبارةِ على مكائنِ البحث المختلفةِ وأنت سَتَعْرفُ ما أَعْني. المبتدئون. . . إقرأْ هذا الخَطِّ - إستعمال مكائنِ بحث يَتضمّنُ a يَتعلّمُ منحنى. العديد مِنْ بِداية مستعملي الإنترنتِ، بسبب هذه الأضرارِ، أصبحَ مثبّط العزيمة ومُحبطة.
مثل a صحفي وَضعَه، "لا يُشوّفُ محسوبيةَ إلى زبائنِ عملِها بالتأكيد a مزيّة نادرة في هذه الأوقاتِ." إتّجهتْ مكائنُ البحث إلى مجرىِ عائدات هامِّ على نحو متزايد. التنسيب المدفوع: بالأضافة إلى الإفتتاحيةَ الرئيسيةَ قادتْ نَتائِجَ بحثِ، مكائن البحث تَعْرضُ a ثانية - وأحياناً ثلث - تسجيل الذي تجاريُ عادة في الطبيعةِ. الأكثر تَدْفعُ، الأعلى أنت سَتَظْهرُ في نَتائِجِ البحثَ. الإدراج المدفوع: مُعلن أَو دُفْعات شريكِ راضيةِ التي ماكنةِ البحث لغَصّ موقعِه وتَتضمّنُ النَتائِجَ في التسجيل التحريريِ الرئيسيِ. لذا؟ . . . على الأرجح لِكي يَكُونَ في قائمةِ الإغتيال ولكن من الناحية الثانية - لا ضماناتَ. بالطبع أولئك الذين يَرْفضونَ أَنْ يُفضّلوا بَعْض المحبّين روادَ صناعة مثل Google الذي يَنْشرُ النتائجَ المدفوعةَ، لكن بشكل واضح علاماتَهم كما ' تَبنّى الصلاتَ. '

إمكانية ' هذه للربحِ ' آلهة بحثِ (التي لحدّ الآن لَمْ تَجْعلْ ربحَ كثيرَ) لأَخْذ الأجورِ لإمَالَة عملياتِ بحثهم، لا يُمْكن أنْ يُستَثنى. لكن كa باحث، قائمة الإغتيال أنت مجهّز ببالمحرّكِ يَجِبُ أَنْ يُصنّفَ من الواضح في طلبِ الصِلة بالموضوعِ والإهتمامِ. لغات قيادةِ بحثِ يُمْكِنُ أَنْ تَكُونَ مركّبَ في أغلب الأحيان والخوارزميةَ مشوّشةَ والكبيرةَ فريدةُ إلى كُلّ إله مستند على عددِ حوادثِ البحثِ يُعبّرُ في a صفحة، إذا يَظْهرُ في عنوانِ الصفحةَ، أَو في a عنوان، أَو يو آر إل نفسه، أَو بطاقة معلومات الصفحة الخ. أَو على a معدّل مرجّح عدد مِنْ هذه أعداد كبيرةِ الصلةِ. ومثال على ذلك: - Google (www.google.com (http://www.google.com)) يَستعملُ ع تُ PageRankه المُسَجَّل براءة إختراع ويُصنّفُ أهميةَ نَتائِجِ البحثِ بفَحْص الصلاتِ التي تُؤدّي إلى a موقع معيّن. الصلات الأكثر التي تُؤدّي إلى a موقع، الأعلى الموقع مُصَنَّفُ. تفرقعْ على الشعبيةِ!
مشهد ألتا، هوت بوت، لايكوس، إنفوسيك وأدلة كلمة إستعمالِ بحثِ إم إس إن الدليليةِ - وصول سريع إلى ملايينِ الوثائقِ. قلة تركيب installِ دليلِ ودقةِ سيّئةِ مِنْ حجمِ دبليو دبليو دبليو، سوف لَنْ يَجْعلَ تَفتيش أيّ أسهل. العدد الكبير للمواقعِ فهرسَ. تَفتيش الكلمة الدليليةِ يُمكنُ أَنْ يَكُونَ صعبَ للحُصُول على الحقِّ.
في الواقع، على أية حال، إنتشار a كلمة دليلية مُتَأَكِّدة لَيستْ دائماً بالنسبة إلى صلةَ a صفحة. خُذْ هذا المثالِ. أي بحث على الساري - الزيّ الوطني للهند في a ماكنة بحث شعبية، عادَ بينه أفضلُ مواقع، الصلات التالية:
?www.scri.sari.ac.uk/- (http://www.scri.sari.ac.uk/-) معهدِ بحثِ المحصولِ الإسكتلنديِ

?www.ubudsari.com/ (http://www.ubudsari.com/) -a منتج pluginع صحّي في أندونيسيا
?www.sari-energy.org/ (http://www.sari-energy.org/) - مبادرة جنوبِ آسيا الإقليميةِ للتعاونِ وتطويرِ الطاقةِ
مواقع مفيدة جداً لشخص ما إهتمّتْ بمعْرِفة كثيراً كيف يَلْفُّ أَو تقليد الساري؟ ! (حَسناً، لا صلاةَ تَذْهبُ لاجواب لهاَ. . . سواء تَحْبُّ الجوابَ أَو لَسْتَ! ) بإستعمال الكلمات الدليليةِ لتَحديد كيف كُلّ صفحة سَتُصنّفُ في نَتائِجِ البحثِ ولا تَحْسبُ عددَ حالاتِ ببساطة a كلمة على a صفحة، مكائن بحث تُحاولُ جَعْل مراهنِ تصنيف الرتب بتَخصيص الوزنِ الأكثرِ إلى الأشياءِ تَحْبُّ العناوينَ، عناوين فرعية، وهكذا.
الآن، مالم عِنْدَكَ a يُوضّحُ فكرةَ ما أنت تَبْحثُ عنه، هو قَدْ يَكُون صعبَ أَو مستحيلَ أَنْ يَستعملَ a بحث كلمة دليليةِ، خصوصاً إذا مفرداتِ الموضوعِ غريبةُ. بنفس الطريقة، أسندَ المفهومَ بحثَ إيكسايتِ (بدلاً مِنْ كلماتِ فرديةِ، الكلمات التي تَدْخلُ إلى a بحث يُجمّعُ ويُحاولُ تَقْرير المعنى) a مهمّة صعبة ويُنتجُ نَتائِجَ متناقضةَ.
إضافةً إلى مَنْ يُراجعُ أَو يُقيّمُ هذه المواقعِ للنوعيةِ أَو السلطةِ؟ هم يَجْمعونَ ببساطة مِن قِبل a برنامج حاسوبِ. هذه مكائنِ البحث النشيطةِ تَعتمدُ على آلياتِ الإسترجاعِ الإلكترونيةِ دَعتْ "العناكبَ"، "زواحف"، أَو "رجال آليون"، لزيَاْرَة مواقعِ الويب، على a قاعدة منتظمة ويَسترجعُ كلمات دليليةَ ذات العلاقةَ لفَهْرَسَة وخَزْن في a قاعدة بيانات قابلة للبحث. ومِنْ هذه قاعدةِ البيانات الضخمةِ تُنتجُ نَتائِجَ صعبةَ وشاملةَ في أغلب الأحيان. . . . النَتائِج التي صلتهم مُحدَّدةُ بحاسباتِهم. المواقع غير ذات علاقة (نسبة عالية مِنْ ضوضاءِ، كما هو يُدْعَى)، آليات كبيرة مشكوك فيها وسيطرة نوعية رديئةِ قَدْ يَكُونان نتيجةَ أقل تدخّل بشري للتَخَلُّص من الزبالةِ. تدخّل فكرِ الإنسانيِ يَحْلُّ كُلّ المَسابر. . . . إقرأْ على.
منذ البداية ماكنة بحث - ياهوو إلى about.com, Snap.com, ماجلان، NetGuide، يَذْهبُ شبكةً، LookSmart، إن بي سي آي ونقطة بداية، كُلّ أدلة الموضوعِ تُفهرسُ وتُراجعُ الوثائقَ تحت الأصنافِ - تَجْعلُهم سهلة الانقياد أكثر. على خلاف مكائنِ البحث النشيطةِ، هذه مكائنِ البحث السلبيةِ أَو المختارةِ الإنسانِ مثل لا يَجُوبُ الويبَ مباشرة ومسيطر عليه إنساني، إعتِماد على مقالاتِ فرديةِ. ربما الأسهل للإسْتِعْمال في البلدةِ، لكن تركيب installَ الفَهْرَسَة هذه مكائنِ البحث تَغطّي فقط a جزء صغير مِنْ العددِ الفعليِ لدبليو دبليو دبليو يُحدّدُ موقع وهكذا بالتأكيد لَيسَ رهانَكَ إذا تَنْوى معيّنَ، يُضيّقُ أَو مواضيع معقّدة.
تعيينات موضوعِ قَدْ تَكُون خاطئةَ أو مشوّشةَ أو إعتباطيةَ. أي يُفتّشُ نظرات بحثاً عن المبارياتِ فقط في الأوصافِ قدّمَ. أبداً لا يَحتوي نَصَّ كاملَ مِنْ الويبِ يَرتبطونَ إلى - أنت يُمْكِنُ فقط أَنْ تُفتّشُ الذي تَرى العناوينَ، أوصاف، أصناف موضوعِ، الخ. تُحدّدُ عمليةُ العملِ الإنسانيِ المركّزةِ عملةِ قاعدةِ بيانات، حجم، نسبة النمو وtimeliness. أنت يَجِبُ أَنْ تَتفرّعَ خلال الأصنافِ مراراً وتكراراً قبل الوصول في الصفحةِ الصحيحةِ. هم قَدْ يَكُونون عِدّة شهور وراء الأوقاتَ بسبب الحاجةِ للمنظمةِ الإنسانيةِ. المحاولة التي تَبْحثُ عن بَعْض الموضوعِ الغامضِ. . . . الفرص للناسِ الذي يَبقونَ الدليلَ أنْ إستثنوا تلك الصفحاتِ. من الواضح، مكائن يُمْكِنُ أَنْ تَحْسبَ الكلمات الدليليةَ بصورة عمياء لَكنَّهم لا يَستطيعونَ جَعْل قرارِ بديهيِ كبشر يُمْكِنُ أَنْ. لكن ثمّ لماذا أدلة محرَّرة من قبل الإنسان تَرْدُّ بكُلّ هذه الزبالةِ؟ !
وهنا حول تلك مكائنِ بحث meta. أي بحث شامل على كامل دبليو دبليو دبليو يَستعملُ المحورَ الكبيرَ، Dogpile، طريق سريع 61، نظام سلوث للبحث على الإنترنت أَو Savvysearch، غطاء وثائق قدر ما محتملة قَدْ تُصوّتُ كجيدة فكرة كa تسوّق توقّفِ واحد. مكائن بحث ميتا لا تَخْلقُ قواعدَ بياناتهم الخاصةَ. يَعتمدونَ على ماكنةِ البحث النشيطةِ والسلبيةِ الحاليةِ تُفهرسُ لإسْتِرْجاع نَتائِجِ البحثِ. والحقيقة ذاتها التي يَدْخلونَ أدلةَ الكلمة الدليليةِ المتعدّدةِ تُخفّضُ وقتَ رَدِّهم. هو متأكّد يُوفّرُ وقتَكَ بتَفتيش عِدّة مكائن بحث حالاً لكن على حساب النَتائِجِ الساحقةِ والغير مرغوبةِ والعاطلةِ. . . . الأكثر بكثير - أخطاء مهمة. يَختلفُ نمطُ البحثِ الأصلي عن موقعِ البحثِ لتَفتيش الموقعِ، لذا نفس البحثِ لَيسَ ملائمَ دائماً في برامجِ ماكنةِ البحث المختلفةِ. تَتفاوتُ النوعيةُ وحجمُ قواعدِ البيانات على نحو واسع.
مكائن البحث المرجّحة مثل Ask Jeeves وRagingSearch يَسْمحانِ للمستعملِ لطِباعَة الإستفساراتِ بانجليزية واضحة بدون معرفةِ تَفتيش متقدّمةِ، ثانيةً على حساب التَفتيش الخاطئِ والغير مُفصّلِ. تَحْبُّ مراجعةُ أَو مصادرُ كبيرةُ دارُ مقاصة Argus (www.clearinghouse.net (http://www.clearinghouse.net)),
eBlast (eblast.com) ودليل المكتبي إلى الإنترنتِ (lii. org). يُقيّمونَ نوعيةَ موقعِ ويب مِنْ المصادرِ يَجِدونَ أَو يَقْبلونَ المقالاتَ مِنْ لكن الغطاءَ a عدد أقل ما يمكن مِنْ المواقعِ.
كa مسؤول موقع، تسجيل موقعكَ بلوحاتِ الإعلانات الأكبرِ في ساحة التايمس يُمْكِنُ أَنْ تَحْصلَ عليك أقرب إلى البنجو! للباحثِ. أولئك الذين لَمْ يَعْرُفوا حتى بأنّك وَجدتَ قبل في غرفةِ جلوسكَ في وقتِ نيويورك!
تسجيل يو آر إل كَ a لا brainer، يَعتبرُ جيلَ تَجَمُّع مرورِ إلى موقعِكَ. بالتأكيد a طريقة سريعة ورخيصة، رغم ذلك فقط a مكوّن إستراتيجيةِ التسويق العامّةِ الذي في نفسه لَنْ يَعْرضَ أي ضماناتِ، لا نَتائِجَ وطلباتَ فوريةَ واصلا جُهداً لمسؤولِ الموقع. تَحْكمُ التجارةُ الويبَ. مثل هكذا a رجل كهف الإنترنتِ بارزِ وَضعَه، "يَجِدُ ناشري ويبِ تَعَامُل مع مكائنِ البحث أيضاً لِكي يَكُونوا a يُحبطُ مسعى. يُريدُ كُلّ شخصُ صفحاتُهم لِكي تَكُونَ سهلةَ للعالمِ أَنْ تَجدَ، لكن يَحْصلُ على موقعِكَ أدرجَ يُمكنُ أَنْ يَكُونَ قاسيَ. مواقع بحثِ قَدْ تَأْخذُ a وقت طويل لإدْراج موقعِكَ، قَدْ لا يُدرجَه مطلقاً، وقَدْ يُسقطُه بعد بضعة شهور بدون أي سبب. إذا تُعيدُ تقديم في أغلب الأحيان، بينما هو مغريُ جداً ليَعمَلُ، أنت قَدْ حتى تُوْسَمُ a spamdexer وتَمْنعُ مِنْ a موقع بحثِ. وأما بالنسبة إلى مُحَاوَلَة أَنْ تُصبحَ a تصنيف رتب جيد، يَنْسيه! أنت يَجِبُ أَنْ تَجاري كُلّ القواعد الغامضة والمُتَغَيّرة باستمرار a دزينة مكائنِ بحث مختلفةِ، وتُعدّلُ الكلمات الدليليةَ على صفحاتِكِ فقط لذا. . . طول الوَقت قتال ضدّ النظريةِ المعقولةِ جداً التي في الحقيقة لا شيئ من هذا مادة تَهْمُّ، وتُخصّصُ مواقعَ البحثَ تصنيف رتب عشوائياً أَو بالنزوةِ.
"للإحْسان إستعمال محرّكاتِ البحث عن مواقع الويبِ -- للإيجاد الذي تَحتاجُ وتَتفادى إنهيار جليدي مِنْ ضرباتِ غير ذات علاقةِ - مكائن بحث إختيارِ الذي مناسبة بشكل جيد جداً إلى حاجاتِكِ. وخشية أن أنت تُريدُ بُكاء "أنت آلهة خالدة! أين في العالمِ نحن؟ "، يَقضّي بضعة ساعات تُصبحُ ماهرةَ باعتدال بكُلّ. كُلّ أعمال بعض الشّيء بشكل مختلف، بِأهمية جداً فيما يتعلق بكَمْ تُوسّعُ أَو تُضيّقُ a بحث.
إيجاد ماكنةِ البحث الملائمةِ لحاجةِ معلوماتِكِ المعيّنةِ، يُمْكِنُه الإحْباط. لإسْتِعْمال هذه مكائنِ البحث عملياً، من المُهمِ يَفْهمُ ما هم، كَمْ يَعْملونَ، وكَمْ يَختلفونَ. لومثال على ذلكِ: - بينما إستعمال a meta ماكنة بحث، يَتذكّرُ بأنّ كُلّ محرّك لَهُ طرقُه الخاصةُ للعَرْض والنَتائِجِ الكبيرةِ. تذكّرْ، يُفتّشُ الإستراتيجياتَ تُؤثّرُ على النَتائِجِ. إذا المستعملِ غافل عن إستراتيجياتِ البحثِ الأساسيةِ، نَتائِج قَدْ تَكُون مبقّعةَ.
إقتِباس تشارلي موريس (المحرّر السابق لمجلّةِ مطوّرِ الويبَ) - "مكائن بحث وأدلة يَبْقيانِ، وفي الحقيقة إزدهار، لأنهم كُلّ نحن عِنْدَنا. إذا تُريدُ إسْتِعْمال ثروةِ المعلوماتِ الذي الويبُ، أنت يَجِبُ أَنْ تَكُونُ قادر على الإيجاد الذي تُريدُ، ومكائن بحث وأدلة الطريقَ الوحيدَ ليَعمَلُ ذلك. تَحْصلُ على نَتائِجِ البحثِ الجيدةِ مسألة فرصةِ. إعتِماد على ما أنت تَبْحثُ عنه، أنت قَدْ تُصبحُ a قائمة لحمية مِنْ المصادرِ الجيدةِ، أَو أنت قَدْ تَحْصلُ على الصفحةِ بعد صفحةِ الهراءِ غير ذو علاقةِ. مِن قِبل يَنقّي بحثَكَ بشكل مرهق، ويَستعملُ عِدّة مكائن بحث وأدلة مختلفة (وخصوصاً بإستعمال أدلةِ الخاصيّةِ الملائمةِ)، أنت يُمْكِنُ أَنْ تَجدَ عادة الذي تَحتاجُ في النهاية."
مكائن البحث مفيدة جداً، لا شَكَّ. حقّ مِنْ يُصبحُ a وجهة نظر سريعة a موضوع لإيجاد معلوماتِ الإتصالِ الخبيرةِ. . . حقاً تَكْمنُ بَعْض القضايا في حضنِهم. الآن السبب ذاته نَنزعجُ مِنْ هذه مكائنِ البحث كثيراً لأنهم كُلّ نحن عِنْدَنا! مع ذلك متأكّدة هناك الكثير مِنْ الغرفةِ للتحسينِ، حاجة الساعةَ أَنْ لا تَمْسكَ في منتصف الطريقِ. مِن قِبل ببساطة فَهْم الذي، هكذا وأين يُريدُ، أنت تُنقذُ نفسك مصيرَ هِتاف الذي مثلِ يهوديِ قديمِ "إذا إعتاشَ الله على الأرضِ، ناس يَكْسرونَ نوافذَه."
التَفتيش السعيد!
Liji a خَريج في عِلْمِ البرامجِ، مَع a ذوق للكتابة على أيّ شئِ تحت الشمسِ. تَضِعُ مهارتَها لعَمَل، كتابة مقالاتِ تقنيةِ في مناطقِها مِنْ الإهتمامِ التي تَتضمّنُ برمجة الإنترنتِ وتصميم مواقع الويبِ والتطويرِ , ecommerce وقضايا ذات علاقة أخرى.

https://fbcdn-sphotos-d-a.akamaihd.net/hphotos-ak-ash4/482113_236967293114455_1193518507_n.png (http://www.dzbatna.com)
©المشاركات المنشورة تعبر عن وجهة نظر صاحبها فقط، ولا تُعبّر بأي شكل من الأشكال عن وجهة نظر إدارة المنتدى (http://www.dzbatna.com)©

استعمل مربع البحث في الاسفل لمزيد من المواضيع

سريع للبحث عن مواضيع في المنتدى