వియుక్త వికీపీడియా/డేటా
వియుక్త వికీపీడియా |
---|
(చర్చ) |
జనరల్ |
అభివృద్ధి ప్రణాళిక |
|
గమనికలు, చిత్తుప్రతులు, చర్చలు |
|
ఉదాహరణలు మరియు నమూనాలు |
డేటా సాధనాలు |
చారిత్రక |
ముఖ్యమైన మాడ్యూళ్ళను పొందండి మరియు ఒకదానికొకటి సమానమైన మాడ్యూళ్ళను కనుగొనండి
- పనిముట్టు
- abstract-wiki-ds.toolforge.org
- మూలం
- GitHub: abstract-wikipedia-data-science
- Phabricator
- T263678
- ప్రదర్శన వీడియో (3 నిమిషాలు, యూట్యూబ్)
- వియుక్త వికీపీడియా డేటా సైన్స్, Outreachy డెమోతో
- ప్రదర్శన ఆడియో (41 నిమిషాలు)
వివరణ
వివిధ వికీ ప్రాజెక్టులు మరియు భాషలలోని Scribunto గుణకాలు వివిధ విధులను నిర్వహించడానికి ఉపయోగిస్తారు. వియుక్త వికీపీడియా లక్ష్యంతో, మేము ఇప్పుడు అన్ని కమ్యూనిటీ రచయితల ఫంక్షన్లను ఒకే చోట పూల్ చేయాలి, రిడెండెన్సీని తొలగించి, వీలైతే ఫంక్షన్లను మాడ్యులైజ్ చేయాలి. ఈ సాధనం వినియోగదారులకు మరియు సహాయకులకు వికీ ఫంక్షన్లను విశ్లేషించడానికి మరియు విలీనం చేయడానికి ఒక స్థలాన్ని ఇస్తుంది, ముఖ్యమైన మాడ్యూళ్ళతో ప్రారంభించి, ఆపై ఇలాంటి మాడ్యూళ్ళను విలీనం చేయడం లేదా రీఫ్యాక్టరింగ్ చేయడం.
ఈ పని Outreachy ఇంటర్న్షిప్ ప్రాజెక్టుగా ప్రారంభమైంది, Liudmila Kalina మరియు Aisha Khatun తో ఇంటర్న్లుగా. ఇంటర్న్షిప్ వ్యవధిలో వారు (మరియు ఇతరులు) పోస్ట్ చేసిన బ్లాగ్ పోస్ట్లను చదవండి: రెండు వారాల నివేదికలు.
దానిలో ఏమి ఉంది
- ముఖ్యమైన మాడ్యూళ్ల జాబితా. ప్రాముఖ్యత యొక్క ఆలోచన పనులలో కొద్దిగా భిన్నంగా ఉండవచ్చు మరియు కాబట్టి మేము బరువు లక్షణాలకు ఒక పద్ధతిని అందిస్తాము. బరువులు తరువాత సాధారణీకరించబడతాయి, కాబట్టి వినియోగదారులు బరువు సంఖ్యల ఇన్పుట్లలో ఏదైనా సంఖ్యను ఉంచవచ్చు, కొన్ని లక్షణాలకు ఎక్కువ ప్రాముఖ్యతను సూచించే అధిక సంఖ్య.
- వికీ ప్రాజెక్ట్ వారీగా ఫిల్టర్లు (వికీపీడియా, వికీబుక్స్ మొదలైనవి వంటి కొన్ని లేదా అన్ని ప్రాజెక్టులను ఎంచుకోండి)
- భాష వడపోతలు.
- మాడ్యూల్ క్లిక్ చేసినప్పుడు, మీరు ఇలాంటి మాడ్యూళ్ల జాబితాను పొందుతారు. వినియోగదారులు వీటిని విలీనం చేయడానికి సహకరించడం ప్రారంభించవచ్చు లేదా ఈ ఫంక్షన్ల యొక్క మరింత మాడ్యులర్ వెర్షన్లను తయారు చేయవచ్చు.
విధానం
ఒకదానికొకటి సమానమైన ముఖ్యమైన మాడ్యూల్స్ మరియు మాడ్యూళ్ళను కనుగొనే పనిని నెరవేర్చడానికి, క్రింది ఉప-పనులు క్రమంలో పూర్తయ్యాయి. ఈ పనులన్నీ GitHub రిపోజిటరీలో తుది ఉత్పత్తికి దారితీశాయి.
- "మాడ్యూల్స్" నేమ్స్పేస్ లోని అన్ని మాడ్యూళ్ల సోర్స్ కోడ్ను సేకరించండి, MediaWiki API ని ఉపయోగించడం ద్వారా (T270494).
- ప్రతిరూప డేటాబేస్ల నుండి ఈ మాడ్యూళ్ళకు సంబంధించిన డేటాను సేకరించండి (T270492):
- ప్రాధాన్యత మాడ్యూళ్ళను గుర్తించడానికి సేకరించిన డేటా యొక్క విశ్లేషణ (T272003):
- సారూప్య మాడ్యూళ్ళను వేరుచేయడానికి క్లస్టరింగ్ గుణకాలు (T270827):
- అదనంగా, పేజీ వీక్షణ డేటాను సేకరించే ప్రయత్నం జరిగింది (T271400): నోట్బుక్, PDF.