File size: 153,769 Bytes
ec2c00e |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 331 332 333 334 335 336 337 338 339 340 341 342 343 344 345 346 347 348 349 350 351 352 353 354 355 356 357 358 359 360 361 362 363 364 365 366 367 368 369 370 371 372 373 374 375 376 377 378 379 380 381 382 383 384 385 386 387 388 389 390 391 392 393 394 395 396 397 398 399 400 401 402 403 404 405 406 407 408 409 410 411 412 413 414 415 416 417 418 419 420 421 422 423 424 425 426 427 428 429 430 431 432 433 434 435 436 437 438 439 440 441 442 443 444 445 446 447 448 449 450 451 452 453 454 455 456 457 458 459 460 461 462 463 464 465 466 467 468 469 470 471 472 473 474 475 476 477 478 479 480 481 482 483 484 485 486 487 488 489 490 491 492 493 494 495 496 497 498 499 500 501 502 503 504 505 506 507 508 509 510 511 512 513 514 515 516 517 518 519 520 521 522 523 524 525 526 527 528 529 530 531 532 533 534 535 536 537 538 539 540 541 542 543 544 545 546 547 548 549 550 551 552 553 554 555 556 557 558 559 560 561 562 563 564 565 566 567 568 569 570 571 572 573 574 575 576 577 578 579 580 581 582 583 584 585 586 587 588 589 590 591 592 593 594 595 596 597 598 599 600 601 602 603 604 605 606 607 608 609 610 611 612 613 614 615 616 617 618 619 620 621 622 623 624 625 626 627 628 629 630 631 632 633 634 635 636 637 638 639 640 641 642 643 644 645 646 647 648 649 650 651 652 653 654 655 656 657 658 659 660 661 662 663 664 665 666 667 668 669 670 671 672 673 674 675 676 677 678 679 680 681 682 683 684 685 686 687 688 689 690 691 692 693 694 695 696 697 698 699 700 701 702 703 704 705 706 707 708 709 710 711 712 713 714 715 716 717 718 719 720 721 722 723 724 725 726 727 728 729 730 731 732 733 734 735 736 737 738 739 740 741 742 743 744 745 746 747 748 749 750 751 752 753 754 755 756 757 758 759 760 761 762 763 764 765 766 767 768 769 770 771 772 773 774 775 776 777 778 779 780 781 782 783 784 785 786 787 788 789 790 791 792 793 794 795 796 797 798 799 800 801 802 803 804 805 806 807 808 809 810 811 812 813 814 815 816 817 818 819 820 821 822 823 824 825 826 827 828 829 830 831 832 833 834 835 836 837 838 839 840 841 842 843 844 845 846 847 848 849 850 851 852 853 854 855 856 857 858 859 860 861 862 863 864 865 866 867 868 869 870 871 872 873 874 875 876 877 878 879 880 881 882 883 884 885 886 887 888 889 890 891 892 893 894 895 896 897 898 899 900 901 902 903 904 905 906 907 908 909 910 911 912 913 914 915 916 917 918 919 920 921 922 923 924 925 926 927 928 929 930 931 932 933 934 935 936 937 938 939 940 941 942 943 944 945 946 947 948 949 950 951 952 953 954 955 956 957 958 959 960 961 962 963 964 965 966 967 968 969 970 971 972 973 974 975 976 977 978 979 980 981 982 983 984 985 986 987 988 989 990 991 992 993 994 995 996 997 998 999 1000 1001 1002 1003 1004 1005 1006 1007 1008 1009 1010 1011 1012 1013 1014 1015 1016 1017 1018 1019 1020 1021 1022 1023 1024 1025 1026 1027 1028 1029 1030 1031 1032 1033 1034 1035 1036 1037 1038 1039 1040 1041 1042 1043 1044 1045 1046 1047 1048 1049 1050 1051 1052 1053 1054 1055 1056 1057 1058 1059 1060 1061 1062 1063 1064 1065 1066 1067 1068 1069 1070 1071 1072 1073 1074 1075 1076 1077 1078 1079 1080 1081 1082 1083 1084 1085 1086 1087 1088 1089 1090 1091 1092 1093 1094 1095 1096 1097 1098 1099 1100 1101 1102 1103 1104 1105 1106 1107 1108 1109 1110 1111 1112 1113 1114 1115 1116 1117 1118 1119 1120 1121 1122 1123 1124 1125 1126 1127 1128 1129 1130 1131 1132 1133 1134 1135 1136 1137 1138 1139 1140 1141 1142 1143 1144 1145 1146 1147 1148 1149 1150 1151 1152 1153 1154 1155 1156 1157 1158 1159 1160 1161 1162 1163 1164 1165 1166 1167 1168 1169 1170 1171 1172 1173 1174 1175 1176 1177 1178 1179 1180 1181 1182 1183 1184 1185 1186 1187 1188 1189 1190 1191 1192 1193 1194 1195 1196 1197 1198 1199 1200 1201 1202 1203 1204 1205 1206 1207 1208 1209 1210 1211 1212 1213 1214 1215 1216 1217 1218 1219 1220 1221 1222 1223 1224 1225 1226 1227 1228 1229 1230 1231 1232 1233 1234 1235 1236 1237 1238 1239 1240 1241 1242 1243 1244 1245 1246 1247 1248 1249 1250 1251 1252 1253 1254 1255 1256 1257 1258 1259 1260 1261 1262 1263 1264 1265 1266 1267 1268 1269 1270 1271 1272 1273 1274 1275 1276 1277 1278 1279 1280 1281 1282 1283 1284 1285 1286 1287 1288 1289 1290 1291 1292 1293 1294 1295 1296 1297 1298 1299 1300 1301 1302 1303 1304 1305 1306 1307 1308 1309 1310 1311 1312 1313 1314 1315 1316 1317 1318 1319 1320 1321 1322 1323 1324 1325 1326 1327 1328 1329 1330 1331 1332 1333 1334 1335 1336 1337 1338 1339 1340 1341 1342 1343 1344 1345 1346 1347 1348 1349 1350 1351 1352 1353 1354 1355 1356 1357 1358 1359 1360 1361 1362 1363 1364 1365 1366 1367 1368 1369 1370 1371 1372 1373 1374 1375 1376 1377 1378 1379 1380 1381 1382 1383 1384 1385 1386 1387 1388 1389 1390 1391 1392 1393 1394 1395 1396 1397 1398 1399 1400 1401 1402 1403 1404 1405 1406 1407 1408 1409 1410 1411 1412 1413 1414 1415 1416 1417 1418 1419 1420 1421 1422 1423 1424 1425 1426 1427 1428 1429 1430 1431 1432 1433 1434 1435 1436 1437 1438 1439 1440 1441 1442 1443 1444 1445 1446 1447 1448 1449 1450 1451 1452 1453 1454 1455 1456 1457 1458 1459 1460 1461 1462 1463 1464 1465 1466 1467 1468 1469 1470 1471 1472 1473 1474 1475 1476 1477 1478 1479 1480 1481 1482 1483 1484 1485 1486 1487 1488 1489 1490 1491 1492 1493 1494 1495 1496 1497 1498 1499 1500 1501 1502 1503 1504 1505 1506 1507 1508 1509 1510 1511 1512 1513 1514 1515 1516 1517 1518 1519 1520 1521 1522 1523 1524 1525 1526 1527 1528 1529 1530 1531 1532 1533 1534 1535 1536 1537 1538 1539 1540 1541 1542 1543 1544 1545 1546 1547 1548 1549 1550 1551 1552 1553 1554 1555 1556 1557 1558 1559 1560 1561 1562 1563 1564 1565 1566 1567 1568 1569 1570 1571 1572 1573 1574 1575 1576 1577 1578 1579 1580 1581 1582 1583 1584 1585 1586 1587 1588 1589 1590 1591 1592 1593 1594 1595 1596 1597 1598 1599 1600 1601 1602 1603 1604 1605 1606 1607 1608 1609 1610 1611 1612 1613 1614 1615 1616 1617 1618 1619 1620 1621 1622 1623 1624 1625 1626 1627 1628 1629 1630 1631 1632 1633 1634 1635 1636 1637 1638 1639 1640 1641 1642 1643 1644 1645 1646 1647 1648 1649 1650 1651 1652 1653 1654 1655 1656 1657 1658 1659 1660 1661 1662 1663 1664 1665 1666 1667 1668 1669 1670 1671 1672 1673 1674 1675 1676 1677 1678 1679 1680 1681 1682 1683 1684 1685 1686 1687 1688 1689 1690 1691 1692 1693 1694 1695 1696 1697 1698 1699 1700 1701 1702 1703 1704 1705 1706 1707 1708 1709 1710 1711 1712 1713 1714 1715 1716 1717 1718 1719 1720 1721 1722 1723 1724 1725 1726 1727 1728 1729 1730 1731 1732 1733 1734 1735 1736 1737 1738 1739 1740 1741 1742 1743 1744 1745 1746 1747 1748 1749 1750 1751 1752 1753 1754 1755 1756 1757 1758 1759 1760 1761 1762 1763 1764 1765 1766 1767 1768 1769 1770 1771 1772 1773 1774 1775 1776 1777 1778 1779 1780 1781 1782 1783 1784 1785 1786 1787 1788 1789 1790 1791 1792 1793 1794 1795 1796 1797 1798 1799 1800 1801 1802 1803 1804 1805 1806 1807 1808 1809 1810 1811 1812 1813 1814 1815 1816 1817 1818 1819 1820 1821 1822 1823 1824 1825 1826 1827 1828 1829 1830 1831 1832 1833 1834 1835 1836 1837 1838 1839 1840 1841 1842 1843 1844 1845 1846 1847 1848 1849 1850 1851 1852 1853 1854 1855 1856 1857 1858 1859 1860 1861 1862 1863 1864 1865 1866 1867 1868 1869 1870 1871 1872 1873 1874 1875 1876 1877 1878 1879 1880 1881 1882 1883 1884 1885 1886 1887 1888 1889 1890 1891 1892 1893 1894 1895 1896 1897 1898 1899 1900 1901 1902 1903 1904 1905 1906 1907 1908 1909 1910 1911 1912 1913 1914 1915 1916 1917 1918 1919 1920 1921 1922 1923 1924 1925 1926 1927 1928 1929 1930 1931 1932 1933 1934 1935 1936 1937 1938 1939 1940 1941 1942 1943 1944 1945 1946 1947 1948 1949 1950 |
{
"nbformat": 4,
"nbformat_minor": 0,
"metadata": {
"colab": {
"name": "Data Preprocessing.ipynb",
"provenance": [],
"collapsed_sections": []
},
"kernelspec": {
"name": "python3",
"display_name": "Python 3"
},
"language_info": {
"name": "python"
},
"widgets": {
"application/vnd.jupyter.widget-state+json": {
"34decfb6324c408d84623733b3bd6ecc": {
"model_module": "@jupyter-widgets/controls",
"model_name": "HBoxModel",
"state": {
"_view_name": "HBoxView",
"_dom_classes": [],
"_model_name": "HBoxModel",
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.5.0",
"box_style": "",
"layout": "IPY_MODEL_66c4e371a3054554901730af6ca0951a",
"_model_module": "@jupyter-widgets/controls",
"children": [
"IPY_MODEL_c3f8c02f6de748b5ab48d6638c7c53cd",
"IPY_MODEL_2dd99de5175746a5ab89f9fe6fb6f237"
]
}
},
"66c4e371a3054554901730af6ca0951a": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"c3f8c02f6de748b5ab48d6638c7c53cd": {
"model_module": "@jupyter-widgets/controls",
"model_name": "FloatProgressModel",
"state": {
"_view_name": "ProgressView",
"style": "IPY_MODEL_f6c0e3b64c474a4ea81c7a1a91bcafc8",
"_dom_classes": [],
"description": "",
"_model_name": "FloatProgressModel",
"bar_style": "info",
"max": 1,
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"value": 1,
"_view_count": null,
"_view_module_version": "1.5.0",
"orientation": "horizontal",
"min": 0,
"description_tooltip": null,
"_model_module": "@jupyter-widgets/controls",
"layout": "IPY_MODEL_27c231d4b970407589f7ee27d37b32c1"
}
},
"2dd99de5175746a5ab89f9fe6fb6f237": {
"model_module": "@jupyter-widgets/controls",
"model_name": "HTMLModel",
"state": {
"_view_name": "HTMLView",
"style": "IPY_MODEL_659ce9bbb99e4ba1bd2b6ac82d65c63c",
"_dom_classes": [],
"description": "",
"_model_name": "HTMLModel",
"placeholder": "",
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"value": " 8203495/0 [19:14<00:00, 6713.43 examples/s]",
"_view_count": null,
"_view_module_version": "1.5.0",
"description_tooltip": null,
"_model_module": "@jupyter-widgets/controls",
"layout": "IPY_MODEL_ddccad359dc748c2ac9a9e374b068858"
}
},
"f6c0e3b64c474a4ea81c7a1a91bcafc8": {
"model_module": "@jupyter-widgets/controls",
"model_name": "ProgressStyleModel",
"state": {
"_view_name": "StyleView",
"_model_name": "ProgressStyleModel",
"description_width": "initial",
"_view_module": "@jupyter-widgets/base",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.2.0",
"bar_color": null,
"_model_module": "@jupyter-widgets/controls"
}
},
"27c231d4b970407589f7ee27d37b32c1": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"659ce9bbb99e4ba1bd2b6ac82d65c63c": {
"model_module": "@jupyter-widgets/controls",
"model_name": "DescriptionStyleModel",
"state": {
"_view_name": "StyleView",
"_model_name": "DescriptionStyleModel",
"description_width": "",
"_view_module": "@jupyter-widgets/base",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.2.0",
"_model_module": "@jupyter-widgets/controls"
}
},
"ddccad359dc748c2ac9a9e374b068858": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"c38d088c611b4158b6135e2942b1fdf6": {
"model_module": "@jupyter-widgets/controls",
"model_name": "HBoxModel",
"state": {
"_view_name": "HBoxView",
"_dom_classes": [],
"_model_name": "HBoxModel",
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.5.0",
"box_style": "",
"layout": "IPY_MODEL_23982da6026145ca8edb6bef10dacb27",
"_model_module": "@jupyter-widgets/controls",
"children": [
"IPY_MODEL_efb16a8839c64631a6e3c991298be840",
"IPY_MODEL_7517b89025364c7484204f6b1e6842ec"
]
}
},
"23982da6026145ca8edb6bef10dacb27": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"efb16a8839c64631a6e3c991298be840": {
"model_module": "@jupyter-widgets/controls",
"model_name": "FloatProgressModel",
"state": {
"_view_name": "ProgressView",
"style": "IPY_MODEL_6c95161afcdf4537a4c88d5d8f9f9677",
"_dom_classes": [],
"description": "100%",
"_model_name": "FloatProgressModel",
"bar_style": "success",
"max": 821,
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"value": 821,
"_view_count": null,
"_view_module_version": "1.5.0",
"orientation": "horizontal",
"min": 0,
"description_tooltip": null,
"_model_module": "@jupyter-widgets/controls",
"layout": "IPY_MODEL_c5ca8d23745f462abaa8760d96277bc7"
}
},
"7517b89025364c7484204f6b1e6842ec": {
"model_module": "@jupyter-widgets/controls",
"model_name": "HTMLModel",
"state": {
"_view_name": "HTMLView",
"style": "IPY_MODEL_1f2af56fdeb94687be042c84eaba5944",
"_dom_classes": [],
"description": "",
"_model_name": "HTMLModel",
"placeholder": "",
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"value": " 821/821 [05:33<00:00, 2.46ba/s]",
"_view_count": null,
"_view_module_version": "1.5.0",
"description_tooltip": null,
"_model_module": "@jupyter-widgets/controls",
"layout": "IPY_MODEL_a9ad8c6cdea84f94ba6f3e8220284a5e"
}
},
"6c95161afcdf4537a4c88d5d8f9f9677": {
"model_module": "@jupyter-widgets/controls",
"model_name": "ProgressStyleModel",
"state": {
"_view_name": "StyleView",
"_model_name": "ProgressStyleModel",
"description_width": "initial",
"_view_module": "@jupyter-widgets/base",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.2.0",
"bar_color": null,
"_model_module": "@jupyter-widgets/controls"
}
},
"c5ca8d23745f462abaa8760d96277bc7": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"1f2af56fdeb94687be042c84eaba5944": {
"model_module": "@jupyter-widgets/controls",
"model_name": "DescriptionStyleModel",
"state": {
"_view_name": "StyleView",
"_model_name": "DescriptionStyleModel",
"description_width": "",
"_view_module": "@jupyter-widgets/base",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.2.0",
"_model_module": "@jupyter-widgets/controls"
}
},
"a9ad8c6cdea84f94ba6f3e8220284a5e": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"6a984c7f824945eaa129f4338a41eb98": {
"model_module": "@jupyter-widgets/controls",
"model_name": "HBoxModel",
"state": {
"_view_name": "HBoxView",
"_dom_classes": [],
"_model_name": "HBoxModel",
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.5.0",
"box_style": "",
"layout": "IPY_MODEL_91d919d820f24a32858a93cd7f888964",
"_model_module": "@jupyter-widgets/controls",
"children": [
"IPY_MODEL_5a6ec425477742819436036bd74b90bc",
"IPY_MODEL_ada286a2ce304344b315595cbf9a0fbd"
]
}
},
"91d919d820f24a32858a93cd7f888964": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"5a6ec425477742819436036bd74b90bc": {
"model_module": "@jupyter-widgets/controls",
"model_name": "FloatProgressModel",
"state": {
"_view_name": "ProgressView",
"style": "IPY_MODEL_3ff688bb51134668a35c8d5d78c13f8a",
"_dom_classes": [],
"description": "100%",
"_model_name": "FloatProgressModel",
"bar_style": "success",
"max": 787,
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"value": 787,
"_view_count": null,
"_view_module_version": "1.5.0",
"orientation": "horizontal",
"min": 0,
"description_tooltip": null,
"_model_module": "@jupyter-widgets/controls",
"layout": "IPY_MODEL_b81b0e66bd2f41349bb22710fbfde48b"
}
},
"ada286a2ce304344b315595cbf9a0fbd": {
"model_module": "@jupyter-widgets/controls",
"model_name": "HTMLModel",
"state": {
"_view_name": "HTMLView",
"style": "IPY_MODEL_27ee4d56eac14611bc43662dee11dec0",
"_dom_classes": [],
"description": "",
"_model_name": "HTMLModel",
"placeholder": "",
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"value": " 787/787 [15:30<00:00, 1.18s/ba]",
"_view_count": null,
"_view_module_version": "1.5.0",
"description_tooltip": null,
"_model_module": "@jupyter-widgets/controls",
"layout": "IPY_MODEL_e06a2cb41dc3443c92a8b827cf441376"
}
},
"3ff688bb51134668a35c8d5d78c13f8a": {
"model_module": "@jupyter-widgets/controls",
"model_name": "ProgressStyleModel",
"state": {
"_view_name": "StyleView",
"_model_name": "ProgressStyleModel",
"description_width": "initial",
"_view_module": "@jupyter-widgets/base",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.2.0",
"bar_color": null,
"_model_module": "@jupyter-widgets/controls"
}
},
"b81b0e66bd2f41349bb22710fbfde48b": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"27ee4d56eac14611bc43662dee11dec0": {
"model_module": "@jupyter-widgets/controls",
"model_name": "DescriptionStyleModel",
"state": {
"_view_name": "StyleView",
"_model_name": "DescriptionStyleModel",
"description_width": "",
"_view_module": "@jupyter-widgets/base",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.2.0",
"_model_module": "@jupyter-widgets/controls"
}
},
"e06a2cb41dc3443c92a8b827cf441376": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"f0ef7c3f87be47578aa066026f5fe551": {
"model_module": "@jupyter-widgets/controls",
"model_name": "HBoxModel",
"state": {
"_view_name": "HBoxView",
"_dom_classes": [],
"_model_name": "HBoxModel",
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.5.0",
"box_style": "",
"layout": "IPY_MODEL_6214637f5e324f0cb09598000707a16c",
"_model_module": "@jupyter-widgets/controls",
"children": [
"IPY_MODEL_e8f55ff4dbec42b0b797b2ae8bf481ec",
"IPY_MODEL_2035e71033b24d04a6ce90dc93f32a05"
]
}
},
"6214637f5e324f0cb09598000707a16c": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"e8f55ff4dbec42b0b797b2ae8bf481ec": {
"model_module": "@jupyter-widgets/controls",
"model_name": "FloatProgressModel",
"state": {
"_view_name": "ProgressView",
"style": "IPY_MODEL_cae620d3a0734790ac81d3d606513e5e",
"_dom_classes": [],
"description": "100%",
"_model_name": "FloatProgressModel",
"bar_style": "success",
"max": 509,
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"value": 509,
"_view_count": null,
"_view_module_version": "1.5.0",
"orientation": "horizontal",
"min": 0,
"description_tooltip": null,
"_model_module": "@jupyter-widgets/controls",
"layout": "IPY_MODEL_5808ec10342f4ac98f3bc86f406d78f0"
}
},
"2035e71033b24d04a6ce90dc93f32a05": {
"model_module": "@jupyter-widgets/controls",
"model_name": "HTMLModel",
"state": {
"_view_name": "HTMLView",
"style": "IPY_MODEL_db18ae79d6a4413fbf277249e378b087",
"_dom_classes": [],
"description": "",
"_model_name": "HTMLModel",
"placeholder": "",
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"value": " 509/509 [03:23<00:00, 2.50ba/s]",
"_view_count": null,
"_view_module_version": "1.5.0",
"description_tooltip": null,
"_model_module": "@jupyter-widgets/controls",
"layout": "IPY_MODEL_5a231e0b34ef48bfb315278e7e4f2e91"
}
},
"cae620d3a0734790ac81d3d606513e5e": {
"model_module": "@jupyter-widgets/controls",
"model_name": "ProgressStyleModel",
"state": {
"_view_name": "StyleView",
"_model_name": "ProgressStyleModel",
"description_width": "initial",
"_view_module": "@jupyter-widgets/base",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.2.0",
"bar_color": null,
"_model_module": "@jupyter-widgets/controls"
}
},
"5808ec10342f4ac98f3bc86f406d78f0": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"db18ae79d6a4413fbf277249e378b087": {
"model_module": "@jupyter-widgets/controls",
"model_name": "DescriptionStyleModel",
"state": {
"_view_name": "StyleView",
"_model_name": "DescriptionStyleModel",
"description_width": "",
"_view_module": "@jupyter-widgets/base",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.2.0",
"_model_module": "@jupyter-widgets/controls"
}
},
"5a231e0b34ef48bfb315278e7e4f2e91": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"e2d5e1bb562c4b0dba40f24dd71d98a8": {
"model_module": "@jupyter-widgets/controls",
"model_name": "HBoxModel",
"state": {
"_view_name": "HBoxView",
"_dom_classes": [],
"_model_name": "HBoxModel",
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.5.0",
"box_style": "",
"layout": "IPY_MODEL_eee2412775964e56a4159c8fd0347ae7",
"_model_module": "@jupyter-widgets/controls",
"children": [
"IPY_MODEL_c36964b86cab4eca92ac910591f8fac5",
"IPY_MODEL_18cee808afd748318fec88ea47c2783d"
]
}
},
"eee2412775964e56a4159c8fd0347ae7": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"c36964b86cab4eca92ac910591f8fac5": {
"model_module": "@jupyter-widgets/controls",
"model_name": "FloatProgressModel",
"state": {
"_view_name": "ProgressView",
"style": "IPY_MODEL_e9dd0a95ab534e40b9d1624b3030b75d",
"_dom_classes": [],
"description": "100%",
"_model_name": "FloatProgressModel",
"bar_style": "success",
"max": 473687,
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"value": 473687,
"_view_count": null,
"_view_module_version": "1.5.0",
"orientation": "horizontal",
"min": 0,
"description_tooltip": null,
"_model_module": "@jupyter-widgets/controls",
"layout": "IPY_MODEL_285168d1a05b4a549fca6df86846617e"
}
},
"18cee808afd748318fec88ea47c2783d": {
"model_module": "@jupyter-widgets/controls",
"model_name": "HTMLModel",
"state": {
"_view_name": "HTMLView",
"style": "IPY_MODEL_c4464235b50947aa97ec74c854e297fe",
"_dom_classes": [],
"description": "",
"_model_name": "HTMLModel",
"placeholder": "",
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"value": " 473687/473687 [01:40<00:00, 4730.08ex/s]",
"_view_count": null,
"_view_module_version": "1.5.0",
"description_tooltip": null,
"_model_module": "@jupyter-widgets/controls",
"layout": "IPY_MODEL_cd05d34eefe0445cbb49eb902222d333"
}
},
"e9dd0a95ab534e40b9d1624b3030b75d": {
"model_module": "@jupyter-widgets/controls",
"model_name": "ProgressStyleModel",
"state": {
"_view_name": "StyleView",
"_model_name": "ProgressStyleModel",
"description_width": "initial",
"_view_module": "@jupyter-widgets/base",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.2.0",
"bar_color": null,
"_model_module": "@jupyter-widgets/controls"
}
},
"285168d1a05b4a549fca6df86846617e": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"c4464235b50947aa97ec74c854e297fe": {
"model_module": "@jupyter-widgets/controls",
"model_name": "DescriptionStyleModel",
"state": {
"_view_name": "StyleView",
"_model_name": "DescriptionStyleModel",
"description_width": "",
"_view_module": "@jupyter-widgets/base",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.2.0",
"_model_module": "@jupyter-widgets/controls"
}
},
"cd05d34eefe0445cbb49eb902222d333": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
}
}
}
},
"cells": [
{
"cell_type": "code",
"metadata": {
"id": "PGi1VxEmeage"
},
"source": [
"%%capture\n",
"\n",
"!pip install git+https://github.com/huggingface/datasets.git\n",
"!pip install git+https://github.com/huggingface/transformers.git\n",
"!pip install hazm"
],
"execution_count": 3,
"outputs": []
},
{
"cell_type": "code",
"metadata": {
"id": "nTGq9PrXe69x"
},
"source": [
"from hazm import word_tokenize\n",
"from hazm import sent_tokenize\n",
"import re\n",
"import six\n",
"\n",
"# from normalizer import normalize\n",
"\n",
"persian_regex = \"0-9۰۱۲۳۴۵۶۷۸۹ءآئابتثجحخدذرزسشصضطظعغفقلمنهوپچژکگیە\\u200c\"\n",
"\n",
"\n",
"def filter_by_lang_regex(text, ratio=0.7, regex=\"0-9۰۱۲۳۴۵۶۷۸۹ءآئابتثجحخدذرزسشصضطظعغفقلمنهوپچژکگیە\\u200c\"):\n",
" candidate_text = re.sub(r\"[^\" + regex + \"]+\", \" \", six.ensure_str(text)).replace(\" \", \"\")\n",
" text = text.replace(\" \", \"\")\n",
"\n",
" return True if (len(candidate_text) / len(text)) > ratio else False\n",
"\n",
"\n",
"def filter_by_num_tokens(text, gt=64):\n",
" return True if len(word_tokenize(text)) > gt else False\n",
"\n",
"\n",
"def filter_by_num_sents(text, gt=2):\n",
" return True if len(sent_tokenize(text)) > gt else False\n",
"\n",
"\n",
"def normalizer(text, do_lowercase=False):\n",
" if do_lowercase:\n",
" text = text.lower()\n",
"\n",
" return text\n"
],
"execution_count": 5,
"outputs": []
},
{
"cell_type": "code",
"metadata": {
"id": "dFtMFjt1e-ab"
},
"source": [
"import ast\n",
"import logging\n",
"import os\n",
"import sys\n",
"from dataclasses import dataclass, field\n",
"from typing import Dict, List, Optional, Tuple\n",
"\n",
"from datasets import load_dataset\n",
"from tokenizers import ByteLevelBPETokenizer\n",
"from transformers import (\n",
" HfArgumentParser,\n",
")\n",
"\n",
"# from data_utils import (\n",
"# filter_by_lang_regex,\n",
"# filter_by_num_tokens,\n",
"# filter_by_num_sents,\n",
"# normalizer\n",
"# )"
],
"execution_count": 7,
"outputs": []
},
{
"cell_type": "code",
"metadata": {
"colab": {
"base_uri": "https://localhost:8080/",
"height": 171,
"referenced_widgets": [
"34decfb6324c408d84623733b3bd6ecc",
"66c4e371a3054554901730af6ca0951a",
"c3f8c02f6de748b5ab48d6638c7c53cd",
"2dd99de5175746a5ab89f9fe6fb6f237",
"f6c0e3b64c474a4ea81c7a1a91bcafc8",
"27c231d4b970407589f7ee27d37b32c1",
"659ce9bbb99e4ba1bd2b6ac82d65c63c",
"ddccad359dc748c2ac9a9e374b068858"
]
},
"id": "FU6Xn131fCXy",
"outputId": "252f2bfa-7be8-4e2e-e022-513560b6adca"
},
"source": [
"raw_dataset = load_dataset(\n",
" \"oscar\",\n",
" \"unshuffled_deduplicated_fa\",\n",
" split=\"train[:1%]\"\n",
")\n",
"\n",
"raw_dataset"
],
"execution_count": 11,
"outputs": [
{
"output_type": "stream",
"text": [
"Downloading and preparing dataset oscar/unshuffled_deduplicated_fa (download: 9.74 GiB, generated: 37.24 GiB, post-processed: Unknown size, total: 46.98 GiB) to /root/.cache/huggingface/datasets/oscar/unshuffled_deduplicated_fa/1.0.0/84838bd49d2295f62008383b05620571535451d84545037bb94d6f3501651df2...\n"
],
"name": "stdout"
},
{
"output_type": "display_data",
"data": {
"application/vnd.jupyter.widget-view+json": {
"model_id": "34decfb6324c408d84623733b3bd6ecc",
"version_minor": 0,
"version_major": 2
},
"text/plain": [
"HBox(children=(FloatProgress(value=1.0, bar_style='info', max=1.0), HTML(value='')))"
]
},
"metadata": {
"tags": []
}
},
{
"output_type": "stream",
"text": [
"Dataset oscar downloaded and prepared to /root/.cache/huggingface/datasets/oscar/unshuffled_deduplicated_fa/1.0.0/84838bd49d2295f62008383b05620571535451d84545037bb94d6f3501651df2. Subsequent calls will reuse this data.\n"
],
"name": "stdout"
},
{
"output_type": "execute_result",
"data": {
"text/plain": [
"Dataset({\n",
" features: ['id', 'text'],\n",
" num_rows: 820350\n",
"})"
]
},
"metadata": {
"tags": []
},
"execution_count": 11
}
]
},
{
"cell_type": "code",
"metadata": {
"colab": {
"base_uri": "https://localhost:8080/"
},
"id": "r1BNAEG-fQjr",
"outputId": "68719640-0b25-41ac-c540-0342e1d5777c"
},
"source": [
"raw_dataset"
],
"execution_count": 12,
"outputs": [
{
"output_type": "execute_result",
"data": {
"text/plain": [
"Dataset({\n",
" features: ['id', 'text'],\n",
" num_rows: 820350\n",
"})"
]
},
"metadata": {
"tags": []
},
"execution_count": 12
}
]
},
{
"cell_type": "code",
"metadata": {
"colab": {
"base_uri": "https://localhost:8080/",
"height": 213,
"referenced_widgets": [
"c38d088c611b4158b6135e2942b1fdf6",
"23982da6026145ca8edb6bef10dacb27",
"efb16a8839c64631a6e3c991298be840",
"7517b89025364c7484204f6b1e6842ec",
"6c95161afcdf4537a4c88d5d8f9f9677",
"c5ca8d23745f462abaa8760d96277bc7",
"1f2af56fdeb94687be042c84eaba5944",
"a9ad8c6cdea84f94ba6f3e8220284a5e",
"6a984c7f824945eaa129f4338a41eb98",
"91d919d820f24a32858a93cd7f888964",
"5a6ec425477742819436036bd74b90bc",
"ada286a2ce304344b315595cbf9a0fbd",
"3ff688bb51134668a35c8d5d78c13f8a",
"b81b0e66bd2f41349bb22710fbfde48b",
"27ee4d56eac14611bc43662dee11dec0",
"e06a2cb41dc3443c92a8b827cf441376",
"f0ef7c3f87be47578aa066026f5fe551",
"6214637f5e324f0cb09598000707a16c",
"e8f55ff4dbec42b0b797b2ae8bf481ec",
"2035e71033b24d04a6ce90dc93f32a05",
"cae620d3a0734790ac81d3d606513e5e",
"5808ec10342f4ac98f3bc86f406d78f0",
"db18ae79d6a4413fbf277249e378b087",
"5a231e0b34ef48bfb315278e7e4f2e91",
"e2d5e1bb562c4b0dba40f24dd71d98a8",
"eee2412775964e56a4159c8fd0347ae7",
"c36964b86cab4eca92ac910591f8fac5",
"18cee808afd748318fec88ea47c2783d",
"e9dd0a95ab534e40b9d1624b3030b75d",
"285168d1a05b4a549fca6df86846617e",
"c4464235b50947aa97ec74c854e297fe",
"cd05d34eefe0445cbb49eb902222d333"
]
},
"id": "c3aO-qU3lQtU",
"outputId": "74035e28-55ff-4dcd-b840-92254c3614e0"
},
"source": [
"dataset = raw_dataset.filter(lambda example: filter_by_lang_regex(example[\"text\"], ratio=0.75))\n",
"dataset = dataset.filter(lambda example: filter_by_num_tokens(example[\"text\"], gt=128))\n",
"dataset = dataset.filter(lambda example: filter_by_num_sents(example[\"text\"], gt=2))\n",
"dataset = dataset.map(normalizer)"
],
"execution_count": 13,
"outputs": [
{
"output_type": "display_data",
"data": {
"application/vnd.jupyter.widget-view+json": {
"model_id": "c38d088c611b4158b6135e2942b1fdf6",
"version_minor": 0,
"version_major": 2
},
"text/plain": [
"HBox(children=(FloatProgress(value=0.0, max=821.0), HTML(value='')))"
]
},
"metadata": {
"tags": []
}
},
{
"output_type": "stream",
"text": [
"\n"
],
"name": "stdout"
},
{
"output_type": "display_data",
"data": {
"application/vnd.jupyter.widget-view+json": {
"model_id": "6a984c7f824945eaa129f4338a41eb98",
"version_minor": 0,
"version_major": 2
},
"text/plain": [
"HBox(children=(FloatProgress(value=0.0, max=787.0), HTML(value='')))"
]
},
"metadata": {
"tags": []
}
},
{
"output_type": "stream",
"text": [
"\n"
],
"name": "stdout"
},
{
"output_type": "display_data",
"data": {
"application/vnd.jupyter.widget-view+json": {
"model_id": "f0ef7c3f87be47578aa066026f5fe551",
"version_minor": 0,
"version_major": 2
},
"text/plain": [
"HBox(children=(FloatProgress(value=0.0, max=509.0), HTML(value='')))"
]
},
"metadata": {
"tags": []
}
},
{
"output_type": "stream",
"text": [
"\n"
],
"name": "stdout"
},
{
"output_type": "display_data",
"data": {
"application/vnd.jupyter.widget-view+json": {
"model_id": "e2d5e1bb562c4b0dba40f24dd71d98a8",
"version_minor": 0,
"version_major": 2
},
"text/plain": [
"HBox(children=(FloatProgress(value=0.0, max=473687.0), HTML(value='')))"
]
},
"metadata": {
"tags": []
}
},
{
"output_type": "stream",
"text": [
"\n"
],
"name": "stdout"
}
]
},
{
"cell_type": "code",
"metadata": {
"colab": {
"base_uri": "https://localhost:8080/"
},
"id": "LbXtEZXos76B",
"outputId": "b9ddfc61-ee18-426c-de65-74fb5979f62a"
},
"source": [
"dataset"
],
"execution_count": 14,
"outputs": [
{
"output_type": "execute_result",
"data": {
"text/plain": [
"Dataset({\n",
" features: ['id', 'text'],\n",
" num_rows: 473687\n",
"})"
]
},
"metadata": {
"tags": []
},
"execution_count": 14
}
]
},
{
"cell_type": "code",
"metadata": {
"colab": {
"base_uri": "https://localhost:8080/",
"height": 137
},
"id": "1YNhYq4nyEXj",
"outputId": "37f1ddff-9b80-4b7e-8edc-76eac80e28b7"
},
"source": [
"dataset[1][\"text\"]"
],
"execution_count": 18,
"outputs": [
{
"output_type": "execute_result",
"data": {
"application/vnd.google.colaboratory.intrinsic+json": {
"type": "string"
},
"text/plain": [
"'قـــــــــــــــــرار بود با هم کنـــــــــــــار بیایم نه اینکه از کنــــــــــــار هم رد بشیم...!!!\\nاگر روزی دلت لبریز غم بود گذارت بر مزار کهنه ام بود بگو این بی نصیب خفته در خاک یه روزی عاشق و دیوانه ام بود...\\nخبر به دورترین نقطه جهان برسد نخواست او به من خسته ، بی کمان برسد شکنجه بیشتر از این که پیش چشم خودت کسی که سهم تو باشد به دیگران برسد خدا کند ، که نفرین نمی کنم نکند به او که عاشق او بوده ام زیان برسد خدا کند فقط این عشق از سرم برود خدا کند که فقط زود آن زمان برسد...\\nترسم که شبی از غم ناگه بمیرم در بستر دلسوز با آه بمیرم آن لحظه آخر که اجل گفت بمیر ای کاش تو را بینم و آنگاه بمیرم\\nخوشبختی را دیروز به حراج گذاشتند ولی حیف که من زاده ی امروزم... خدایا جهنم فرداست پس چرا امروز می سوزم ؟!!\\nدر کرانه محبت رنگ چشمانت را دیدم در عمق بی کران آسمان رخ تو را دیدم دیدنت آرزوی من شده آن را از من دریغ مکن\\nکوه باشی صخره هایت می شوم... اشک باشی دیدگانت می شوم... رود باشی چشمه سارت می شوم... دوست باشی دوستدارت می شوم...!'"
]
},
"metadata": {
"tags": []
},
"execution_count": 18
}
]
},
{
"cell_type": "code",
"metadata": {
"colab": {
"base_uri": "https://localhost:8080/",
"height": 137
},
"id": "bF8ReR0VyE6u",
"outputId": "f03eb513-00b1-4f9d-fde4-2ed27d418754"
},
"source": [
"dataset[1][\"text\"]"
],
"execution_count": 19,
"outputs": [
{
"output_type": "execute_result",
"data": {
"application/vnd.google.colaboratory.intrinsic+json": {
"type": "string"
},
"text/plain": [
"'قـــــــــــــــــرار بود با هم کنـــــــــــــار بیایم نه اینکه از کنــــــــــــار هم رد بشیم...!!!\\nاگر روزی دلت لبریز غم بود گذارت بر مزار کهنه ام بود بگو این بی نصیب خفته در خاک یه روزی عاشق و دیوانه ام بود...\\nخبر به دورترین نقطه جهان برسد نخواست او به من خسته ، بی کمان برسد شکنجه بیشتر از این که پیش چشم خودت کسی که سهم تو باشد به دیگران برسد خدا کند ، که نفرین نمی کنم نکند به او که عاشق او بوده ام زیان برسد خدا کند فقط این عشق از سرم برود خدا کند که فقط زود آن زمان برسد...\\nترسم که شبی از غم ناگه بمیرم در بستر دلسوز با آه بمیرم آن لحظه آخر که اجل گفت بمیر ای کاش تو را بینم و آنگاه بمیرم\\nخوشبختی را دیروز به حراج گذاشتند ولی حیف که من زاده ی امروزم... خدایا جهنم فرداست پس چرا امروز می سوزم ؟!!\\nدر کرانه محبت رنگ چشمانت را دیدم در عمق بی کران آسمان رخ تو را دیدم دیدنت آرزوی من شده آن را از من دریغ مکن\\nکوه باشی صخره هایت می شوم... اشک باشی دیدگانت می شوم... رود باشی چشمه سارت می شوم... دوست باشی دوستدارت می شوم...!'"
]
},
"metadata": {
"tags": []
},
"execution_count": 19
}
]
},
{
"cell_type": "code",
"metadata": {
"colab": {
"base_uri": "https://localhost:8080/",
"height": 154
},
"id": "e9PeXs9us_J1",
"outputId": "c8bcdc3d-0cb7-4124-c183-3920ee92e1e5"
},
"source": [
"dataset[2][\"text\"]"
],
"execution_count": 17,
"outputs": [
{
"output_type": "execute_result",
"data": {
"application/vnd.google.colaboratory.intrinsic+json": {
"type": "string"
},
"text/plain": [
"'«یكی از كهن ترین و سنتی ترین روش های انسان برای انتقال معرفت به نسل های بعد، قصه ها و حكایات بوده است. قصه، ناب ترین و خالص ترین بخش ادبیات است؛ چرا كه ما را به دورانی پیش از پیدایش تفاسیر و تعابیر امروز مان می برد. قصه ها شادند، سرگرم كننده اند، نمایشی اند، اما فراتر از همه ، معرفت را به شكلی دلپذیر منتقل می كنند.»\\nیک بام و دو هوا خودکشی کن!!/طنز خران آزاد و... خوبی خوبی است! نگرانی از اتهام ناحق! آدمایی از جنس بلور چه حاجتی به قهرمان؟! و عدالت اجرا شد!! پرنده ات را آزاد کن! برخورد پیامبر با زنِ خواننده من مسئول کره ها هستم!!! شایعه مرگ شاه! بالا نرو، بسیار خطرناک است!! .... همچنان در منزل اول اسیر! \"کلام امید\" لیست آخرین پستها\\nحكایت و داستان پرتال فرهنگی مذهبی لاهوت مشاوره و روانشناسی(مهدی معتقد) آنتی صهیونیسم نخود به اندیشان پیام امیر(ع) پیام های پیامبر(ص) وب نامه مدارا حکایات حکیمانه آیا به از این نمی توان بود؟ وب باران شفیعی مطهر همه پیوندها\\nقصه های شهرهرت(11) سخنان كوتاه حكیمانه(210) سروده های حكیمانه(165) طنزهای حكیمانه(394) حكایات حكیمانه(806)'"
]
},
"metadata": {
"tags": []
},
"execution_count": 17
}
]
},
{
"cell_type": "code",
"metadata": {
"colab": {
"base_uri": "https://localhost:8080/",
"height": 154
},
"id": "FkOymCKvx71W",
"outputId": "9594adf9-d110-42d1-c913-c89643dd31e7"
},
"source": [
"dataset[3][\"text\"]"
],
"execution_count": 20,
"outputs": [
{
"output_type": "execute_result",
"data": {
"application/vnd.google.colaboratory.intrinsic+json": {
"type": "string"
},
"text/plain": [
"'حرکت اصلاح طلبی به معنای یک جریان رفورمیستی، در داخل حاکمیت کنونی، محصول یک پروسۀ کشمکش طولانی درون حکومتی است که ریشه های آن به سالهای بعد از پایان جنگ ایران و عراق و حوادث قبل از 2 خرداد 1376 برمیگردد. این جریان آميزه ای از نيروهای اصلاح طلب مذهبی و سرخورده از انحصار طلبی های جناح تندرو و محافظه کار و بخشی از مردم معترض برخاسته از طبقۀ متوسط جدیداست که به شعارهای رهبران این طیف باور داشته و در رکاب آن قدم برمی دارند. اصلاح طلبان درون حکومتی می کوشند نشان دهند که آنان نه تنها خواهان يک حکومت دموکراتيک و پای بند به اصول مدرن و دموکراتیک و اعلاميۀ جهانی حقوق بشر هستند بلکه درصدد اثبات این مقوله نیز می باشند که تحقق دموکراسی در شکل اسلامی آن ممکن و امکانپذیر است. این حرکت با پذیرفتن چهارچوب نظام جمهوری اسلامی و وفاداری به قانون اساسی آن در پی اصلاحاتی در درون نظام و در پی قبضۀ دوبارۀ قدرت سیاسی است.\\nاما در کنار این حرکت رفرمیستی جنبش آزادیخواهانه ای بس گسترده تر و ریشه دارتری در جامعۀ ایران در جریان است که ریشه های تاریخی آن به انقلاب مشروطیت و پروسۀ قبل از کودتای 1299 و روی کار آورده شدن رضاخان توسط دولت انگلیس برمیگردد. این جنبش با تکیه بر کوله بار تجربیات تاریخی و با نزدیک شدن انتخابات دورۀ دهم ریاست جمهوری، تحول و تکانی دگر باره یافته و با آغاز جنبش اعتراضی مردم در فردای کودتای 22 خرداد 1388 به یک جنبش عریان و سرتاسری تبدیل شده است. آنچه در شرایط کنونی خصلت ویژه به این جنبش توده ای داده و آنرا از جریان رفرمیستی درون حکومتی جدا ساخته همانا ارادۀ میلیونی و مستقل آن و فاصله گیری تدریجی از شعارها و مطالبات محدود شده به چهارچوب نظام جمهوری اسلامی است. این جنبش بلحاظ تاریخی جنبشی مدرن و سکولار است که خواهان جدائی دین از دولت (ضد استبداد) و تأمین حقوق مدنی و شهروندی (دموکراسی خواه) است. این جنبش در ماهیت و پیوستگی دموکراتیک خود هم چنین خواهان برابری حقوق زنان با مردان (فمینیست)، تحقق حقوق ملی ملل ایران (تمرکز زدا) و تقسیم عادلانۀ نعم اجتماعی جامعه (عدالت خواه) است.\\nبا نگاهی گذرا به شعارهای جنبش مردمی در تظاهرات خیابانی و بیانات رهبران حرکت اصلاح طلبان مذهبی روشن می شود که نقطۀ تلاقی مطالبات هر دو جریان در رعایت حقوق مدنی و شهروندی و حاکمیت مردم کلید خورده است. این نقطه، آن کانون اصلی و مرکزی است که اکثریت نیروهای حرکت اصلاح طلبان درون حکومتی و کلیۀ آحاد جنبش اعتراضی بر روی آن اتفاق نظر داشته و مضمون آنرا بی وقفه در شعارهای خود انعکاس می دهند. لیکن خطاست که ما برنامه و یا مطالبات حداقل و حداکثر این دو جریان و یا درک آنان را در رابطه با مقوله های دموکراسی و حاکمیت مردم همگون و یکی پنداریم. این تفاوت حتی در درون حرکت اصلاح طلبان نیز قابل رؤیت است، بطوریکه بخشی از تفکر اصلاح طلبی، تحقق حاکمیت مردم و دمکراسی را در چهارچوب اصل نظام، ولایت فقیه و حکومت دینی و بخشی دیگر خارج از آن قابل دست یابی میداند. این تفاوت در بیانیه ها و مصاحبه های رهبران و یا هواداران حرکت اصلاح طلبان، خصوصاً در خارج کشور، نیز دیده می شود. در حالی که مثلاً، چهره هایی همچون اکبر گنجی به صراحت از تشکیل دولت غیر دینی و سکولار و عدم تحقق مطالبات جنبش سبز و عدم \" انتقال قدرت در چهارچوب قانون اساسی\" جمهوری اسلامی سخن می گوید تعدادی دیگر، از پاسخگوئی به نوع و ماهیت دولت آینده طفره رفته و یا تحقق دموکراسی را در چهارچوب رژیم ولایت فقیه خلاصه و از نوعی \"دموکراسی دینی\" و یا \"اسلامی\" حمایت میکنند.\\nدر همین رابطه اخیراً چهار بیانیه از طرف چهره های شناخته شدۀ حرکت اصلاح طلبان، در داخل و خارج ایران انتشار یافته است که بطور کلی مضمون خواستها و مطالبات اصلی این طیف و نوع نگرش آنان به مقوله های دموکراسی و ماهیت دولت آیندۀ مورد نظر آنان را بیان میکند. بیانیۀ نخست مربوط به میرحسین موسوی است که به عنوان سمبل نمادین رهبری جنبش سبز، مطالباتی را در پنج ماده انتشار داد. بیانیۀ دوم به آقای کروبی تعلق داشته و بیانیۀ سوم توسط آقايان محسن مخملباف و محسن سازگارا (که گاه به صراحت و گاه تلويحاً خود را سخنگوی آقای موسوی معرفی می کنند) منتشر شده که بدون تردید مأمویت رفع شبه ها و ابهامات بیانیۀ آقای موسوی را به عهده داشته است. بیانیۀ چهارم نیز مربوط به پنج تن از اصلاح طلبان یعنی محسن کدیور، عبدالعلی بازرگان، عبدالکریم سروش، اکبر گنجی و سید عطاء الله مهاجرانی بود که بنظر می رسد، هم برای رفع نارسائیها و تکمیل کردن متن بیانیۀ میرحسین موسوی و هم به منظور ارائۀ برنامۀ حداقل حرکت اصلاح طلبان به رشتۀ تحریر در آمده است. بیانیه های فوق بطور کلّی دارای نکات و خواستهایی است که هیچ دموکرات واقعی نمی تواند آنها را رد و یا بر علیه آن موضع گیری کند. لیکن متن هر چهار بیانیه شامل نقصانها و شبهه هایی نیز می شود که هر خوانندۀ بی طرف را پس از مطالعۀ آنها به اندیشه وا میدارد. این کمبودها در مورد بیانۀ آقای موسوی و کروبی، تا حدودی، قابل درک است چرا که بلحاظ شرایط خاص ایران و تنگناهای سیاسی، مسئولیتها و محدومیتهای جاری، لزوم رعایت برخی پرنسیپهای سیاسی و امنیتی از طرف آنها را موجه جلوه می دهد. لیکن دو بیانیۀ دیگر، خصوصاً بیانیۀ پنج نفر از روشنفکران مذهبی که راقمین آنها از ابتدای پيدايش جنبش سبز در صدد معرفی خود بعنوان سخنگو و یا بلندگوی آن کرده اند، در محیط های آرام و امن و بدون مسئولیتهای سیاسی و یا حکومتی به رشتۀ تحریر در آمده و بنابراین محتوای آنها قابل تأمل و بررسی است.\\nاز آنجا که راقمین بیانیه ها بطور آشکار از متن بیانیه های خود به عنوان \"کف مطالبات\" (در بیانیۀ مخملباف و سازگارا) و \"خواستهای حداقلی\" (در بیانیۀ پنج نفر) سخن میرانند روشن نیست که چرا آنها بیانیۀ آقای موسوی را جزو مطالبات \"حداقل\" جنبش به حساب آورده و در پی آن ضرورت تکمیل بیانیه (ویا بیانیه های) موسوی را احساس و تازه بیانیۀ خود را نیز مطالبات حداقل مردم به حساب آورند؟ و این در حالی است که موسوی هیچگونه اشاره ای به \"حداقل\" بودن بیانیۀ خود نداشته است. از سوی دیگر مطالبات عمومی ـ سیاسی یک جنبش را هنگامی می توان \"حداقل\" نامید که تعدادی خواسته های \"حداکثری\" نیز در جوار آن وجود داشته و اصولاً مطالبات \"حداقلی\" در رابطه با مطالبات \"حداکثری\" آن قابل درک و طرح است. همچنین هنگامی که چند بیانیه که راقمین آنها دارای مواضع سیاسی ـ ایدوئولوژیک مشترک و مشابهی هستند ارائه می شود، ضروری است که بين خواسته های حداقلی و حداکثری هر یک از آنها (هر چهار بیانیه) نوعی پيوند منطقی وجود داشته باشد. اما دیده می شود که این بيانيه ها فاقد این خصیصه ها بوده و در وحلۀ اول روشن نمی کنند که خواسته های حداکثری و یا سقف مطالبات میرحسین موسوی و ديگر صادر کنندگان بيانيه ها چيست و در وحلۀ دوم به چه علت از ميان آنها تنها این چند خواسته بعنوان \"حداقل\" و یا \"کف مطالبات\" انتخاب شده و ارائه می شود؟\\nهرچند بیانیۀ پنج نفر (کدیور، گنجی، سروش، بازرگان و مهاجرانی) تعدای از مشکلات عدیدۀ جامعۀ ایران را بر شمرده و به نحوۀ تغییر و تحول و یا به ارائۀ آلترناتیو و راهکارهای معینی نیز می پردازد، اما از انعکاس و یا پرداختن به معضلات اساسی دیگر جامعۀ ایران طفره رفته و بنوعی آگاهانه آنها را نادیده می انگارد! و این در حالی است که مطالبات سیاسی \"حداقل\"، باید قبل از هر چیزبه نحوۀ نگرش خود به معظلات اساسی جامعۀ مورد نظر پرداخته و یا دست کم اشاره ای درخور وزن این معظلات بدانها داشته باشد! به همین جهت، و برای روشن شدن مسئله، به نکاتی چند پیرامون بخشی از مقولات و مفاهیم ذکر شده و خصوصاً کاستی های آن اشاره ای کوتاه الزامی است.\\nریشه های اساسی و ایدئولوژیک ایدۀ جدائی دین از دولت در ایران به انقلاب مشروطیت و محدود کردن قدرت شاه بر میگردد که در آن، شاه سایۀ خدا (ظل الله) و مشروعیت خود را از خدا میگرفت. این معضل همچنان با به شکست کشاندن ایده های جنبش مشروطیت توسط ارتجاع و روی کار آورده شدن حکومت رضا خان همچنان بصورت لاینحل باقی مانده و با اعلام مذهب رسمی در قانون اساسی به حیات خود ادامه داد. اما دستگاه حکومتی ایران که در دوران پهلوی بر پایۀ ایدۀ \"یک ملت یک زبان و یک دولت\" بنا شده بود با ظهور جمهوری اسلامی شکلی ایدئولوژیک به خود گرفته و در ضمن حفظ ساختار غیرسکولار و تک ملیتی، عنصر ولایت فقیه و استبداد مذهبی را نیز بدان اضافه کرد. در واقع شکست انقلاب 1357 و تحمیل ساختار ایدئولوژیک بر دستگاه حکومتی، حکومت لایۀ معینی، تحت عنوان روحانیت را بر ایران بدنبال داشت. درهم آمیختگی دین با دستگاه دولت از یک طرف، و سیستم تک ملیتی دولت از طرف دیگر، ضرورت مبارزه با هر دو پدیده را پیش روی مدافعین ایجاد دولت مدرن، سکولار و دموکراسی در ایران قرار داد.\\nبحث از این مقوله که دستگاه دولت دارای مفهومی دنیوی و زمینی است، بر این امر دلالت دارد که دولت مدرن نمی تواند مشروعیت خود را با اتکا و یا حواله به یک نیروی متافیزیکی (ماورالطبیعه) کسب و یا بدان تقدّس آسمانی ببخشد. از آنجا که دولت مدرن برگزیدۀ ملت و مجری تصمیمات اوست مشروعیت خود را نیز تنها از ملت (پارلمان) گرفته و باید در برابر او جوابگو باشد. از این جهت دولت مدرن در تداوم منطقی و منشاء مشروعیت خود باید مجری احکام عقل وعرف نیز بوده و براین اساس نمی تواند تابع احکام دینی و یا شريعت باشد. احکام شریعت نشئت گرفته از کٌتب آسمانی و دگمهای مذهبی است که بنا برماهیت خود عناصری ابدی و ازلی بوده و قابل جایگزینی و یا تغییر بدست بشر نیست. این در حالی است که قوانین و احکام عقلی و عرفی عناصری هستند که بدست بشر وضع و با ارادۀ او قابل تغییر و جایگزینی هستند. از طرف دیگر دولت مدرن نمی تواند، خصوصاً، در کشوری که متشکل از ادیان، مذاهب، ملتها، و فرقه های گوناگون است مبلّغ و مروّج دین و یا مذهب و یا نماینده ملت و یا فرهنگی خاص باشد. دولت مدرن آحاد مردم و گروهای تشکیل دهندۀ آنرا در برابر یکدیگر و در برابر قانون مساوی دانسته و نمی تواند بر گروهی (همچون روحانيت و یا گروه ملی) و یا فردی (همچون ولایت فقیه و یا شاه) حق ويژه ای به رسمیت بشناسد.\\nدر همین رابطه بیانیۀ اصلاح طلبان مذهبی (بیانیۀ پنج نفر) شبهه های جدّی در مورد باور آنان به بر پائی سکولاریسم و ایجاد دولت مدرن در ایران و هم چنین اهداف نهائی آنان بوجود آورده است. در حالی که اکبر گنجی بارها به صراحت از اعتقاد خود به جدائی دین از دولت و سکولاریسم سخن گفته و محسن کدیور نیز پیاده کردن سکولاریسم در ایران را به \"نفع روحانیت\" و \"حفظ دین\" ارزیابی کرده اما بيانيه ای را همراه با آقايان مهاجرانی، سروش و بازرگان امضاء کرده اند که متن آن از برچیدن بساط حکومتی که در آن مذهب و دستگاه حکومتی در هم آميخته اند سخنی به میان نیاورده است!؟ این در حالی است که یکی از اساسی ترین مطالبات جنبش آزادیخواهی ایران در یکصد سال اخیر و جنبش جاری سبز را \"جدائی دین از دولت\" تشکیل می دهد. براستی کسانی که در بيانيۀ خود به صراحت همۀ مقامات کشوری را \"انتخابی\" و \" نقد پذیر\"، \" پاسخگو\" و\"دوره ای\" می خواهند و \"افزودن سرکوب و ارعاب\" و \"بحران عمیق\" که مسئولیتش را با \"صاحب ولایت مطلقه\" و \"جائر\" می دانند چرا و به چه علتی از بيان صریح خواست حذف اصل ولايت فقيه و مذهب رسمی از قانون اساسی ايران، آنهم در خارج از کشور، خودداری می کنند؟ آیا منظور راقمین بیانیه از \" ولایت مطلقه\" تنها نفی \"ولی جائر\" کنونی است که در صورت حذف آن \"ولی عادل\" دیگری جایگزین آن خواهد شد، و یا بطور کلّی منظور پایان دادن به حکومت \"فقها\" و ایجاد حکومتی سکولار است؟\\nبرای نیروهای طرفدار جدائی دین از دولت و دولت مدرن روشن نیست که راقمین بیانیه پنج نفر، و کلاً اصلاح طلبان که بارها از \"حکومت مردم\" و \"جمهوریت \" سخن گفته اند، خواستار تحقق جمهوریت دولت آینده هستند، یا حامی اسلامیت آن؟ آیا درک از \"جمهوریت\" همان درک خمینی است که می گفت \"میزان رأی مردم است\" اما در عمل ولیّ فقیه همه کارۀ امور مملکت بود و یا این درک بر پایۀ معیارهای دموکراتیک و مدرن استوار است؟ بیانیۀ پنج نفر روشن نمی کند که آیا اتوریتۀ سیاسی و قوانین مملکتی مشروعیت خود در حکومت آینده از مردم و نماینده گان ملت (پارلمان) خواهد گرفت و یا از ولیّ فقیه، قرآن و سنت؟ تناقض در گفتارها و مصاحبه های پراکنده را چگونه باید ترجمه و ارزیابی کرد و اصلاح طلبان در مورد این تناقص ها چگونه\\u200c می اندیشند؟ عدم پرداختن به شکل و محتوای دولت آینده در بیانیه های اخیرمی تواند بدین معنی تلقی شود که دست کم گروهی از اصلاح طلبان جنبۀ سکولاریستی و ضد استبدادی مبارزۀ مردم ایران در یکصد سال اخیر را به فراموشی سپرده و مٌدل برقراری یک حکومت سکولار را قبول نداشته و یا آگاهانه قصد سایه اندازی بر روی آن را دارند. این شبهه و سایه اندازی در مورد سایر مطالبات اساسی جنبش آزادیخواهی نیز در بیانیۀ پنج نفر دیده میشود.\\nبلحاظ تاریخی مقولۀ \"تمامیت ارضی\" با شکل\\u200cگیری دولت\\u200cهای ملی و مدرن همراه بوده است و مفهوم آن چیزی نیست مگر مرزهای سیاسی و به رسمیت شناخته شدۀ کشور مفروض. لیکن از آن جا که مرزهای سیاسی همواره تابع تحولات سیاسی بوده لذا این مقوله عامل کشمکشهای نظامی، جنگهای داخلی و نزاع های بین\\u200cالمللی نیز بوده است. ریشه و نطفه های ایجاد دولت متمرکز و مدرن در ایران به عصر ترکان صفویان برمیگردد که با تسلط مذهب شیعه و تأمین \"وحدت سیاسی\" دارای مرزهای سیاسی نسبتاً پایدار نیز شد. اما توسعۀ دولت و رشد نهادهای گوناگون آن در ایران همگام با تحولات و پیشرفتهای اقتصادی، سیاسی و فلسفی اروپا نبوده و بنابراین، فقدان زمینه های مادی از موانع برقراری آن نیز باید بحساب آید. ایدۀ ایجاد دولت مدرن به سبک اروپائی در ایران یکی از اهداف دیرین روشنفکران انقلاب مشروطه (خصوصاً آذربایجانیها) بود که تحقق آن در ایران ( به جز در سالهای 1325- 1324یعنی در دوران حکومت ملی آذربایجان) هرگز به واقعیت نه پیوسته و هرکوششی در این جهت نیز با مقاومت ارتجاع داخلی و دخالت قدرتهای خارجی به شکست کشیده شد. اما بر خلاف ایدۀ دولت مدرن و پیوند آن با افکار روشنفکران بومی، برقراری دولت متمرکز و ضد دموکراتیک در ایران پیوند ناگسستنی با منافع دولت انگلیس (در تقابل با پیروزی انقلاب بلشویکی روسیه و برپائی جمهوری نوپای ترکیه) در پروسۀ بعد از پایان جنگ جهانی اول دارد. کودتای 1299 و روی کار آورده شدن رضا خان توسط انگلیس و هم چنین تلاشهای چندین دهۀ کمپانی هند شرقی در منطقه و ایران آغازگر تحولات ضد دموکراتیک و سازمان یافته و برعلیه منافع مردم ایران و ملیتهای آن بود. درک ویژه از\"تمامیت ارضی\" در ایران نیز اساساً مربوط به پروسۀ بعد از برپائی حکومت رضاخان و سیاست برچیدن واحدهای ایالتی قدرت، و امحاء هویت ملی ملیتها از طریق ممنوعیت زبان و فرهنگ آنان بود. این مقوله با رشد بوروکراسی و نهادهای دولتی و تزریق ایدئولوژی برتری \"نژاد آریایی\" و جعل تاریخ و دستکاری در آثار باستانی ایران برای برجسته کردن نقش عنصر فارس توانست خود را در محاسبات سیاسی ایران تثبیت کند.\\nاما بطور تاریخی تلاش در جهت تحقق ایدۀ \" یک ملت ، یک زبان و یک دولت \" و هم چنین درک ویژه از مقولۀ \"تمامیت ارضی ایران\" مختص و منحصر به حکومتها نبوده بلکه بسیاری از روشنفکران تاریخ معاصر ایران نیز در تئوریزه کردن آن قلم زده و قدم برداشته اند. می توان گفت که جامعۀ\\u200c امروز ایران، و به ویژه، روشنفکران آن، در رابطه با مقوله \"تمامیت ارضی ایران\" از یک درک گلوگیر در رنج است و بیشتر روشنفکران نیز هنوز سایۀ سنگین این درک را بر گرده ی خود حمل و از آن رهائی نیافته اند. برای بیشتر ایرانیان دفاع از \"تمامیت ارضی\" بنوعی ضدیت با تجزیه\\u200c طلبی است که یکی از محصولات ترویج ایدۀ \"یک ملت، یک زبان و یک دولت\" و جعلیات تاریخی در مورد پیشینۀ ورود اقوام گوناگون به ایران و دولتها و سلسله های ساختگی آن است. این بینش ایران را نه یک کشور متشکل از فرهنگها، ملیتها و مذاهب گوناگون که به عنوان ارثیۀ پدری و تیول اقلیتی ملی بشمار می آورد که \"حفظ تمامیت ارضی\" آن، پشت قبالۀ ارثیۀ آنان حک شده است. از منظر آنان \"خاک ایران\" متعلق به آنان است و بقیۀ گروه های ملی، فرهنگی و یا مذهبی یا بازماندۀ \"اقوام وحشی\" هستند که به \"ایران\" یورش آوردند و یا توسط اقوام مهاجم ومهاجر فرهنگ و یا زبان اصلی خود را، که همان \"فارسی شیرین\" بوده ، به دست فراموشی سپرده اند، که امروز باید به اصل خود باز گردند. اما اگر پوسته کسب مشروعیت و تاریخ بافی های جعلی را کناری نهیم در می یابیم که نقطه اصلی این تفکر، حرکت آن از خاک و تقدس آن است. اما وقتی تقدس خاک و مقوله \"تمامیت ارضی\" به سرفصل برخورد با اهالی مناطق ملی- جغرافیائی تبدیل شود، می توان گفت که به جای حاکمیت انسان برزمین، این زمین است که برجان انسانها حاکم می شود. بنابراین با استناد به آن تئوری، جان میلیون ها انسان را برای حفظ \"خاک\" و \"تمامیت ارضی\" و برخلاف میل صاحبان اصلی و اهالی آن می توان فدا کرد. درست همین تفکر منشاء تمام پاکسازی های قومی و اعمال شنیع برعلیه بشریت در گوشه و کنار جهان بوده است. این درک نه تنها هیچگونه پیوندی با مفهوم دولت مدرن، حقوق بشر، جامعه مدنی و حق تعیین سرنوشت و یا عنصر عدالت ندارد، بلکه نشان از یک خوی حیوانی و بربریت دارد که سلو بودان میلوسوویچ ها، رابرت کوچاریان ها و سرکسیان ها نمونه های متمدن آن هستند.\\nبنابراین آنچه تاکنون \"تمامیت ارضی ایران\" را در عمل به مخاطره انداخته و انسانها و گروهای ملی را به درجۀ یک و دو تبدیل کرده، و وحدت درونی کشور را زیر سئوال برده، ادامۀ همین درک و از هم پاشیده شدن پلورالیسم ملی و فرهنگی بوده است\\nبا ترسیم این دریاچۀ افکار و گنداب انبار شده در آن، بیانیۀ پنج نفر از روشنفکران اصلاح طلب مذهبی نیز باید در این چهارچوب و با آن پشتوانۀ تاریخی تحلیل و یا به داوری کشیده شود. چرا که این روشنفکران محصول و پروردۀ تفکر دو نظام سلطنت پهلوی و جمهوری اسلامی با تفاوتهای صوری و شباهتهای ماهوی و همگون به یکدیگر هستند. بدین دلیل نیز بی جهت نیست که اولین پیام بیانیۀ پنج نفر با مدافعه از مقولۀ \"تمامیت ارضی ایران \" شروع شده و هرچند راقمین بیانیه خود را \" به عنوان بخش کوچکی از جنبش سبز سراسری مردم ایران\" معرفی کرده اند اما این امر مانع از آن نشده که آنها \"جنبش سبز ایران (را نیز) مدافع تمامیت ارضی ایران\" (به شیوۀ افکار خود) قلمداد و خواسته های خود را مطالبات جنبش سبز به حساب آورند. این امر در وحلۀ اول دهن کجی به مبارزات و شرکت میلیونی ملیتهای ایران در جنبش سبز است که درکی سرکوبگرایانه و نژادپرستانه از مقولۀ \" تمامیت ارضی ایران\" نداشته و در وحلۀ دوم نشانگر عدم صداقت و برخورد قیم مآبانه اصلاح طلبان خارج با جنبش اعتراضی سبز است.\\nبنابراین گنجاندن مقولۀ \"حفظ تمامیت ارضی ایران\" در متن بیانیه پنج نفر از اصلاح طلبان را می توان به نحوۀ درک و برداشت این روشنفکران از مفهوم \"تمامیت ارضی ایران\" مرتبط دانست که در اصل تفاوت چندانی با درک رایج و سنتی ایدئولوگهای پهلوی و پان ایرانیستها ندارد. این بینش هرچند از یک طرف ادامۀ منطقی ایدۀ \"یک ملت، یک زبان و یک دولت\" است اما از سوی دیگر ریشه در ظهور اسلام سیاسی در ایران و سند حقوقی آن یعنی قانون اساسی جمهوری اسلامی دارد. هر چند در قانون اساسی جمهوری اسلامی به ترکیب چند \"قومی و مذهبی\" جامعۀ ایران اشاره شده و به نوعی تنوع وتکثر در آن مورد پذیرش قرار گرفته لیکن این مقولات در همان قانون اساسی تنها به مفهوم \"اقلیتهای زبانی و مذهبی\" مدّ نظر بوده و بنابراین به گروهای ملی و اقلیتهای مذهبی ایران هیچگونه حق و نقشی در حاکمیت و اتوریتۀ سیاسی و یا اعمال نفوذ و نظارت بر سیاست آنها را نداده است. در نتیجه هویتهای برسمت شناخته شده در قانون اساسی جمهوری اسلامی صرفاً جنبۀ زبانی و فرهنگی داشته و دارای موضوعیت حقوقی و سیاسی نیست. درست به همین دلیل نیز، درهمان قانون اساسی، مذهب رسمی کشور شیعه و زبان رسمی ایران فارسی اعلام شده است که در واقع دو رکن اساسی حاکمیت سیاسی: \"ناسیونالیسم ایرانی\" یعنی \"قومیت فارس\" و \"مذهب تشیع\" در ایران را تبیین و تأکید میکند.\\nبنابراین درک ویژه از \"تمامیت ارضی ایران \" از یک طرف تنوع و تکثر در جامعۀ ایران را تنها در حوزۀ زبانی و فرهنگی پنداشته و از طرف دیگر ایران را یکپارچه می انگارد و در نتیجه حقوق گروههای ملی و مذهبی را نیز تنها در آن حوزه به رسمیت می شناسد. این نظریه که هیچگونه سنخیتی با ایده و مفهوم دولت مدرن و جامعۀ مدنی ندارد اعضای جامعه را بصورت یک \"واحد کلّ\" قبول داشته و تنوع و تکثر را ثانوی می پندارد در حالی که آن \"واحد کلّ\" خود از اشتراک اجزاء جداگانه بوجود آمده و باید دارای حقوق برابر نیز باشند. از اینجا می توان نتیجه گرفت که بیانیۀ پنج نفر، حقوق گروهای ملی را بطورعمده با حقوق مندرج در قانون اساسی جمهوری اسلامی قابل تعریف و تبیین دانسته و در نتیجه هرگونه برابری آنها در حوزه های خارج از آن حیطه را مخل و مانع \"وحدت و یکپارچگی\" و\"حفظ تمامیت ارضی ایران\" تلقی می کند. بدین جهت نیز در حالیکه متن بیانیه از \" آزرده\" شدن \" گروه های قومی\"در نتیجۀ \"عملکرد این رژیم\" سخن گفته اما از گنجاندن حقوق و مطالبات آنان با تعاریف مدرن حقوق بشری و دموکراتیک، که بیانیۀ فوق ادعای پیاده کردن و دفاع از آن را دارد، در بندهای دهگانه و یا متن آن امتناع کرده است.\\nکوتاه سخن اینکه مقوله\\u200c \"حفظ تمامیت ارضی\" در عین حال که نیاز به بررسی و بازنگری جدّی و تاریخی دارد نیازمند تعریفی جدید و ارائۀ راه حلهای نوین برای جلوگیری از سوء استفاده و تکرار فجایع رخ داده در دوران پهلوی (پدر و پسر) وجمهوری اسلامی را دارد! چراکه که در تاریخ معاصر ایران سرکوب وحشیانۀ جنبش های آزادیخواهانۀ ملل غیر فارس همواره\\u200c با مستمسک \"حفظ تمامیت ارضی\"، \"تجزیه\\u200c طلبی\" و \"توطئۀ بیگانگان\" صورت پذیرفته است یعنی همان بهانه هایی که امروز جمهوری اسلامی بخشی از آنرا به جنبش سبز ایران نسبت داده و یا رژیم شاه در 29 بهمن 1357 به قیام مردم تبریز نسبت داد. بنابراین چهارچوب افکار و تفکر پنج نفر اصلاح طلبان مذهبی و درک آنان از مقولۀ \"حفظ تمامیت ارضی\" و حقوق ومطالبات ملل غیر فارس ایران درعمل در حیطۀ همان بینش رایج \"تجزیه طلبی\" و \"توطئۀ دشمن\" است که خود آنان در بیانیۀ منتشره از آن به عنوان سوء استفادۀ \" ولیّ جائر در طول 20 سال گذشته ... و از طریق آن دشمن سازی و ایجاد تفرقه میان ملت \" یاد کرده اند. اگرامضاء کننده های بیانیۀ پنج نفر درکی به غیر از نتیجه گیری یاد شده را دارند در آنصورت باید پاسخ دهند که درک آنان از \" تمامیت ارضی ایران\" چگونه و تفاوت آن با درک سلطنت طلبان و پان ایرانیست ها و گروهای نژاد پرست درچیست؟\\nدر ادامۀ همین بحث باید به مورد دیگری نیز اشاره کرد که بی ارتباط با مقولۀ ذکر شده بالا نیست. با اینکه بیانیۀ پنچ نفر به حق \" تعیین سرنوشت مردم ایران\" و \" اقشار متنوع جامعه در تعیین سرنوشت خود\" اشاره داشته است اما روشن نیست که منظور آنان از این \"حق\" چیست و اگر قرار است این \"حق\" شامل \"مردم ایران\" و \"اقشار متنوع جامعه\" شود چرا شامل ملیتهای ایران نمی شود؟ واقعیت این است که درک روشنفکران اصلاح طلب مذهبی از مقولۀ \"حق تعیین سرنوشت\" نیز بی شباهت به درک آنان از\"تمامیت ارضی ایران\"، دموکراسی، جامعۀ مدنی و دولت مدرن نیست.\\nاز آنجا که مبنا و اساس ایدۀ حق تعیین سرنوشت بر نظریۀ حق حاکمیت مردم بنا شده و حق حاکمیت مردم نیز بنوبۀ خود مشروط به حق تعیین سرنوشت آنان بصورت آزادانه است، بنابراین می توان گفت که حق حاکمیت و حق تعیین سرنوشت وابستگی متقابل به یکدیگر دارند. جوهر اصلی و دموکراتيک ایدۀ حق تعيين سرنوشت بصورت تاریخی تشکيل دولت توسط ملت بوده چرا که با انتقال حق حاکميت به مردم افراد نيز از رعیت و یا تبعۀ پادشاهان خارج و به شهروندان آزاد ملی تبدیل شده اند. از اینجا می توان نتیجه گرفت که مقوله هایی چون حق حاکمیت و حق تعيين سرنوشت و یا حق شهروندی همگی جزئی از حقوق دموکراتيکی هستند که در چهارچوب و درون مفهوم دمکراسی جای گرفته است. می توان گفت که حق شهروندی (حقوق فردی) و حق تعيين سرنوشت (حقوق جمعی) حقوقی هستند که ریشۀ و منشاء آن در حکومت مردم بر مردم نهفته است. ایدۀ حق تعيين سرنوشت ملی ضامن و تجلی ارزش های هويت جمعی يک ملت است اما از آنجا که خود ملت متشکل از افراد است، در نتیجه این حق بيانگر حق انتخاب فردی يک شهروند و همچنین نوع حکومتی که شهروندان آنرا می طلبند نیز شود. بنابراین مبارزه برای هر دو حق بمعنای مبارزه برای دموکراسی و حق حاکمیت مردم نیز هست.\\nروشنفکران مذهبی هرچند ادعای دفاع از اصول دموکراسی، حق تعیین سرنوشت، حقوق مدنی و شهروندی مردم ایران را دارند اما درکی را که از این مقوله ها در بیانیۀ خود ارائه می دهند با درک قید شده در سطور بالا تفاوتهای ماهوی دارد. پنج نفر اصلاح طلبان مذهبی، از آنجا که مردم ایران را یکپارچه و به عنوان \"ملت واحد\" درک میکنند بنابراین هرگونه \"تعیین سرنوشت\" آنها را نیزتنها در چهارچوب همین مقولۀ \"وحدانیت\" می فهمند. برای آنان حق و حقوقی که خارج از این یکپارچگی مصنوعی و اجباری قرار داشته باشد قابل تصور نیست. اما جامعۀ ایران تودۀ یکپارچه ای را تشکیل نداده و با مرزهای مذهبی، ملی ـ نژادی و یا جنسی و طبقاتی از یکدیگر جدا می شوند. بنابراین همانگونه که حق تعیین سرنوشت شامل تک تک عناصر تشکیل دهندۀ این گروهها و به عنوان فرد می شود شامل حق تعیین سرنوشت آنان به عنوان جمع نیز میشود. مثلاً زنان به عنوان یک گروه اجتماعی، و صرف نظر از تعلقات ملی، زبانی، مذهبی و طبقاتی، حق دارند به عنوان زن (و بر پایۀ هویت جنسی خود) متشکل شده و برای تحقق مطالبات فردی و \"تعیین سرنوشت\" خود، یعنی حاکم شدن بر بدن خود، نوع پوشش خود و رفع خشونت از خود، و یا لغو قوانین ضد زن مبارزه کنند. اما زنان درعین حال حق دارند به عنوان زنانی که دارای تعلقات ملی هستند، یعنی بر پایۀ هویت ملی خود (بلوچ، عرب، آذربایجانی و...) نیز متشکل شده و برای مطالبات ملی مبارزه و خواستار حق تعیین سرنوشت شوند. بنابراین همانگونه که اعضای گروههای اجتماعی به عنوان فرد دارای هویت مختص به خود و حق تعیین سرنوشت هستند به عنوان جمع نیز داری هویت و حق تعیین سرنوشت میباشند. درک دموکراتیک و مدرن نیز هم حق تعیین سرنوشت فردی و هم حق تعیین سرنوشت جمعی را برسمیت می شناسد. موردی که باید بدان توجه داشت این است که مبارزۀ ملی صرفاً جنبۀ سیاسی دارد و موضوع آن معطوف به حاکمیت و تقسیم قدرت سیاسی است. در واقع هدف مبارزۀ ملی دموکراتیزه کردن حاکمیت از طریق تقسیم قدرت سیاسی و شرکت دادن همۀ گروهای ملی در آن است.\\nاما دیده می شود که مرزهای دموکراسی برای روشنفکران مذهبی درست درهمین نقطه پایان می یابد بطوریکه از نظر آنان هر گروه و یا فردی که \"یکپارچگی\" و نظریۀ \"ملت واحد\" را زیر سئوال برده و یا برهویت جداگانۀ خود، به غیر از هویت رسمی و اجباری، تأکید داشته باشد خود به خود از هرگونه حق تعیین سرنوشت و حقوق سیاسی نیزمحروم میشود. چنین درکی نه با ایدۀ حق تعیین سرنوشت و دموکراسی قرابتی دارد و نه شباهتی به مفهوم جامعۀ مدنی که روشنفکران اصلاح طلب در صدد پی ریزی آنان با بیانیۀ دهگانۀ خود هستند. از منظر روشنفکران مذهبی مرز\"حق تعیین سرنوشت\" و \"دموکراسی\" و مفهوم \"جامعۀ مدنی\" تا بدآنجاست که ارکان اساسی حاکمیت در ایران یعنی نقش زبان فارسی و مذهب شیعه (حاکمیت قوم فارس) نقض نشده و به رسمیت شناخته شود و اگر کسی مرتکب چنین گناهی شود آنگاه سرو کارش با وزارت اطلاعات و امنیت کشور، لباس شخصیها، و سپاه پاسداران بوده و با انگ \"تجزیه طلبی\" و صد البته برای\"حفظ تمامیت ارضی\" و مبارزه با \"توطئۀ بیگانه\" پروسۀ حذف، همچون تاریخ نزدیک به یک قرن اخیر، به چرخش درخواهد آمد. بیانیۀ پنج نفر در حالی که حق جمعی و\" حق فعالیت قانونی احزاب سیاسی، جنبش دانشجوئی و زنان، و نهاد های غیر دولتی ، نهادهای مدنی، اتحادیه های مستقل کارگران و کارمندان\" را \"به رسمیت\" می شناسد، و در مادۀ چهار بیانیۀ خود نیز از تک تک آنان اسم میبرد، اما بر مبنای درک ذکر شدۀ بالا از قبول و تعمیم این حق به گروهای ملی ایران و ذکر ملیتها و یا بقول آنان \"اقوام\" در همان بند خوداری میکند!؟\\nبیانیۀ پنج نفر از تقابل \" جنبش با اقتدارگرایان\" به عنوان \" نزاع بر سر رعایت حقوق بشر و گردن نهادن به خواست های دموکراتیک مردم، تحقق جامعه مدنی، مدارا دینی، به رسمیت شناختن تکثر و تنوع در فضای سیاسی کشور و بالاخره نفی ولایت جائر \" سخن میگوید. اما در عین حال از برچیدن بساط و حذف سیستم ولایت فقیه (یعنی همان ولایت جائر)، از جدائی دین از دولت و سکولاریسم (مدارا دینی ؟)، از حقوق و برابری ملیتها و حق تعیین سرنوشت آنها (به رسمیت شناختن تکثر و تنوع فقط در \"فضای سیاسی کشور\") و از برابری حقوق زنان با مردان خوداری میکند!؟ در تعریف روشنفکران اصلاح طلب نه تنها جائی برای حق تعیین سرنوشت وعنصرعدالت، که از مختصات دولت مدرن و دموکراتیک بوده و محتوای آن بر پایۀ برابری همۀ گروههای انسانی صرف نظر از ملیت، فرهنگ، مذهب، جنسییت و یا رنگ پوست درمقابل یکدیگر و در برابر قانون استوارشده، خبری نیست بلکه حتی از قانون اساسی جمهوری اسلامی نیز که حداقل در آن از حقوق ناقص زبانی و فرهنگی \"اقوام \" ( اصل 15 و 19) سخن به میان آمده گامی عقبتر است.\\nگذشته از اینها پرسیدنی است که اگر بیانیۀ\\u200c پنج نفر برای حمایت و یا تکمیل بیانیۀ\\u200c آقای موسوی و یا در همراهی با دیگر اصلاح طلبان (همچون آقای کروبی) ارائه شده است، که در متن بیانه نیز بصورت \" ما ضمن حمایت کامل از مواضع رهبران جنبش در داخل کشور (موسوی، کروبی و خاتمی)\" آمده است، در آنصورت\\u200c آیا حتی در آن سطح نیز نمی بایستی در بیانیه ماده\\u200cای به\\u200c حقوق گروههای ملی (و یا بقول آنان \"حقوق اقوام\") و جایگاه آنها در مناسبات خود با حاکمیت تخصیص داده\\u200c می شد؟ در حالی که هم خاتمی و هم میر حسین موسوی در بیانیه های خود، و هم بیشتر و شفاف تر از آنها، آقای کروبی، بارها به حقوق \"اقوام\" تأکید داشته و حتی آنرا به یکی از شعارهای انتخاباتی خود تبدیل کرده بود. پس چگونه بیانیۀ پنچ نفر که در تکمیل بیانیه های اصلاح طلبان داخل کشور به تحریر در آمده از پرداختن به این معضل اساسی پرهیز، و حتی از رعایت پیوند منطقی افکار و مطالبات خود با تفکر و خواستهای اصلاح طلبان داخل کشور دوری جسته است؟\\nشاید گفته شود که تأمین و تحقق حقوق مدنی و شهروندی که در بندهای دهگانۀ بیانیه پنج نفر بدان پرداخته شده به خودی خود شامل حقوق ملیتها و پیروان مذاهب گوناگون ایران نیز شده و دیگر نیازی به پرداختن بصورت جداگانه به آنها در بیانیه نبوده است. ولی باید توجه داشت که هرچند در کشوریکه متشکل از موزائیک مذاهب، فرهنگها، و ملل گوناگون است تمرکز بر رعایت حقوق مدنی و شهروندی لزوماً آنرا به یک مقولۀ انسانی و فرا ملی تبدیل می کند چرا که برابری شهروندان در برابر قانون و رعایت بدون قید و شرط آزادیهای فردی و سیاسی نمی تواند بی ارتباط با کل جامعۀ ایران و محدود و یا متعلق به تنها بخشی از اعضای آن جامعه باشد، لیکن افراد و اعضای تشکیل دهندۀ یک کشور عناصر جدا از هم و یا ایزوله شده از یکدیگر و معلق در فضا نبوده بلکه در شکل گروهای ملی، جنسی، مذهبی و یا طبقاتی معنی و مفهوم پیدا میکنند. لذا هر گونه مبارزه برای حقوق مدنی و شهروندی (دموکراسی) خود به خود باید شامل حقوق آن گروهها، طیفها و یا قشرهائی در جامعه شود که این حقوق از آنان سلب و به آنان تعمیم داده نشده و یا در مورد آنان اجرا نشده است. بنابراین هرگونه راه حل پیشنهادی مبتنی بر چیره گی بر این موانع و معضلات نیز، باید این گروهها و اقشار را مخاطب قرار داده و مطالبات آنان را انعکاس دهد.\\nاین امر شامل وضعیت ویژۀ زنان و حقوق آنان در ایران به عنوان یک گروه اجتماعی و جنسی نیز می شود و معلوم نیست که چرا ایده ئولوگها و روشنفکران اصلاح طلب در مصاحبه ها و بیانیه های خارج از کشور خود، حداقل بصورت یک اشارۀ کوتاه نیز، ازاعتراف به \"برابری حقوق زنان با مردان\" اکراه داشته و امنتناع می کنند؟ آیا مثلاً می توان خود را هوادار حقوق مدنی و شهروندی (دموکراسی خواه) دانست ولی در مبارزه برای کسب حقوق زنان بعنوان نیمی از جامعه و یا حقوق ملیتها به عنوان اکثریت جامعۀ ایران تلاش نکرد و یا مطالبات آنان را انعکاس نداده و بی اعتنا از آن گذشت؟ آیا زنان و گروه های ملی ایران جزئی از همان مبارزه کننده هایی نیستند که برای حقوق مدنی و حق شهروندی، رفع دیکتاتوری و چیره گی دموکراسی در جامعه مبارزه می کنند؟ و آیا قرار نیست این حقوق چه بعنوان فرد و چه بعنوان جمع شامل آنان نیز بشود؟ در حالیکه بیانیۀ پنج نفر از \" به رسمیت شناختن حق فعالیت قانونی زنان\" (مادۀ 4) و مبارزات مردم ایران برعلیه حکومت و \" تحقیر و توهین مستمربه ملت توسط حکومت\" سخن می گوید اما برابری حقوق طبیعی زنان با مردان و لغو قوانین تبعیض و تحقیر آمیز نسبت به زنان را مسکوت می گذارد!؟ پرسیدنی است این چگونه برنامۀ حداقلی است که مطالبات یکی از فعالترین گروههای معترض جامعۀ ایران و جنبش سبز مبنی بر برچیدن قوانین قرون وسطائی بر علیه زنان در آن منعکس نیست؟ این چگونه مطالبات حداقلی است که فقط به حق تشکل و فعالیت قانونی زنان بسنده کرده یعنی همان حقی که هم اکنون نیز کم و بیش در جمهوری اسلامی آثاری از آن تحمل میشود؟ پرسیدنی است که درک این روشنفکران از آزادی زنان و حقوق برابر آنان با مردان چگونه و تفاوت آن با درک \"اقتدارگریان حکومتی\" و اصول گرایان درچیست و اصولاً آیا این درک مبتنی بر دگمهای مذهبی و کتاب آسمانی است یا معیارهای مدرن و دموکراتیک؟\\nحذف و مثله کردن پرنسیپهای دموکراسی و یا قائل شدن تقدم و تأخر درتحقق اجزاء آن درایران متأسفانه نه تنها بینش روشنفکران و ایدئولوگهای اصلاح طلبان که درک بسیاری از دستجات سیاسی است. اگر تحقق دموکراسی نمی تواند در یک کشور چند ملیتی چیزی جز حاکمیت همۀ ملیتهای تشکیل دهندۀ آن کشور و حقوق برابر آنان باشد تحقق حقوق زنان و برابری آنان با مردان (حداقل درقانون) نیز نمی تواند جزء تفکیک ناپذیر پرنسیپهای دموکراسی خواهی نباشد! کسی که برای حقوق مدنی، شهروندی و حاکمیت مردم (دموکراسی) می جنگد باید برای برپائی یک دولت سکولار (جدائی دین از دولت)، رفع ستم ملی و مضاعف (برابری حقوق ملیتها) و برچیدن بساط ستم بر زنان (برابری آنان با مردان) و عدالت اجتماعی نیز بجنگد.'"
]
},
"metadata": {
"tags": []
},
"execution_count": 20
}
]
},
{
"cell_type": "code",
"metadata": {
"colab": {
"base_uri": "https://localhost:8080/",
"height": 103
},
"id": "MROY_AUOyJzk",
"outputId": "1ac309f3-2388-45dc-af9f-84ee31a245f8"
},
"source": [
"dataset[10][\"text\"]"
],
"execution_count": 21,
"outputs": [
{
"output_type": "execute_result",
"data": {
"application/vnd.google.colaboratory.intrinsic+json": {
"type": "string"
},
"text/plain": [
"'آینه نیوز: قطعه موسیقی «ای دریغا» در آستانه توزیع اولین قسمت از فصل دوم سریال «شهرزاد» منتشر شد. این اثر که با صدای محسن چاوشی و همراهی آواز سینا سرلک، دوست و همراه قدیمی چاوشی همراه است، «ای دریغا» نام دارد که حسین صفا آن را سروده و محسن چاوشی آهنگسازی کرده و شهاب اکبری تنظیم آن را به عهده داشته است. در «ای دریغا»، احسان نی زن به عنوان نوازنده کمانچه و مجتبی تقی پور به عنوان نوازنده گیتار همکاری داشته اند.\\nدر فصل اول سریال شهرزاد تولید و پخش قطعات متعدد موسیقی در کنار توزیع سریال مورد توجه مخاطبان قرا گرفته بود و حالا در فصل دوم نیز همین رویه توسط عوامل تولید «شهرزاد» مورد نظر قرار گرفته است.'"
]
},
"metadata": {
"tags": []
},
"execution_count": 21
}
]
},
{
"cell_type": "code",
"metadata": {
"colab": {
"base_uri": "https://localhost:8080/",
"height": 154
},
"id": "_fdnSZoKyN2T",
"outputId": "39fcff51-00a4-4ad2-bdb5-85511cd46eb4"
},
"source": [
"dataset[20][\"text\"]"
],
"execution_count": 22,
"outputs": [
{
"output_type": "execute_result",
"data": {
"application/vnd.google.colaboratory.intrinsic+json": {
"type": "string"
},
"text/plain": [
"'امتیاز شما به این کانالوبسایت پردیس ایرانیان آموزش دوره های تخصصی ماساژ زیر نظر مربی فنی و حرفه ای عنوان سایت : پردیس ایرانیان لینک سایت : http://pardisiranian.ir/ آی دی اینستاگرام : pardisiranian.info@ لینک اینستاگرام: […]\\nLeave a commentپیج اینستاگرام, کانال برنزی, لینک سایتآموزش ماساژ زیر نظر فنی حرفه ای, آموزش ماساژ فنی حرفه ای, آموزش ماساژ فنی حرفه ای تهران, دوره ماساژ فدراسیون پزشکی ورزشی, فدراسیون بین المللی ماساژ ایران, ماساژ آروماتراپی, ماساژ تخصصی, ماساژ سوئدی, ماساژ لیفتینگ صورت, مربی آموزش ماساژ\\t\\nبایگانی کانالها گزینش ماه اکتبر 2018 سپتامبر 2018 آگوست 2018 جولای 2018 ژوئن 2018 می 2018 آوریل 2018 فوریه 2018\\nکانال ها بر اساس موضوع گزینش دسته پیج اینستاگرام ربات پیام رسان بله سایر کانال ها کانال آموزشی کانال آی گپ کانال اجتماعی-سیاسی-فرهنگی کانال ایتا کانال برنزی کانال بله کانال بیسفون کانال تجاری کانال تفریحی کانال تلگرام کانال خبری کانال رسمی کانال سروش کانال سلام کانال شخصی کانال گپ کانال محلی کانال نقره ای کانال های طلایی کانال ویسپی لینک سایت مطالب سایت\\nکانال تبلیغاتی \"باکس آگهی\" در پیام رسان بله عنوان کانال : کانال تبلیغاتی \"باکس آگهی\" در پیام رسان بله نام...\\nعنوان سایت:کسب در آمد از طریق گوشی همراه و اپلیکیشن ۷۰۳۰ لینک سایت : https://7030.ir/r/sayed97 توضیحات کامل کانال:سامانه «هفتاد سی»...\\nدکوراسیون داخلی سالن های زیبایی نام پیام رسان: تلگرام و اینستاگرام لینک کانال تلگرام : https://t.me/designer_ir لینک صفحه اینستاگرام :...\\nنصب -تعمیر و فروش انواع کولرگازی عنوان کانال : نصب -تعمیر و فروش انواع کولرگازی نام پیام رسان: تلگرام لینک...\\nکانال بازیگر ایرانی خانم شبنم قلی خانی عنوان کانال : کانال بازیگر ایرانی خانم شبنم قلی خانی نام پیام رسان:...\\nتارنمای جامع ثبت کانال ;کانال سروش,کانال تلگرام,کانال بیسفون, کانال گپ, کانال ویسپی, کانال بیسفون پلاس, کانال ایتا, کانال آی گپ, کانال سلام, پیج اینستاگرام,کانال بله,گروه سروش,گروه تلگرامی,گروه بیسفون,گروه گپ,گروه آی گپ,گروه ایتا,گروه سلام,گروه بله,تبلیغات کانال تلگرام,تبلیغات کانال بیسفون,تبلیغات کانال گپ,تبلیغات کانال ویسپی,تبلیغات کانال بیسفون,تبلیغات کانال ایتا,تبلیغات کانال آی گپ,تبلیغات کانال سلام,تبلیغات کانال بله,گروه تبلیغاتی پیام رسان سروش,گروه تبلیغاتی تلگرام,گروه تبلیغاتی بیسفون,گروه تبلیغاتی گپ,گروه تبلیغاتی ویسپی,گروه تبلیغاتی آی گپ,گروه تبلیغاتی سلام,گروه تبلیغاتی بله,افزایش مببر سروش,خرید ممبر سروش,حرید ممبر تلگرام,افزایش ممبر تلگرام,خرید ممبر بیسفون,افزایش ممبر بیسفون,خرید ممبر ایتا,افزایش ممبر ایتا,خرید ممبرآی گپ,افزایش ممبر آی گپ,حرید ممبر گپ,افزایش ممبرگپ,خرید ممبرسلام,افزایش ممبر سلام,خرید ممبر بله ,افزایش ممبر بله,درگاه پیام رسان داخلی,فروشگاه پیام رسان سروش,فروشگاه پیام رسان بله,فروشگاه پیام رسان گپ,فروشگاه پیام رسان آِ گپ,تبلیغات پیام رسانهای داخلی\\nآموزش ماساژ زیر نظر فنی حرفه ای آموزش ماساژ فنی حرفه ای آموزش ماساژ فنی حرفه ای تهران آون اتوکلاو ارگانیک تریتا انکوباتور انکوباتور یخچالدار تجهیز کامل آزمایشگاه غذایی تعمیر مبل تور آنتالیا تور ارمنستان تور استانبول تور چین تور گرجستان خرید ظرف شویی خرید کولر گازی دوره ماساژ فدراسیون پزشکی ورزشی ربات پیام رسان بله سانتریفیوژ ژربر سانتریفیوژ یونیورسال فدراسیون بین المللی ماساژ ایران فروشگاه ارگانیک تریتا فروشگاه ارگانیک در پیام رسان بله فروشگاه ارگانیک شیراز فروشگاه معتبر ارگانیک ماساژ آروماتراپی ماساژ تخصصی ماساژ سوئدی ماساژ لیفتینگ صورت مربی آموزش ماساژ هود شیمیایی هود لامینار پی اچ متر دیجیتال کانال آموزشی کانال باکس آگهی کانال بله بانک ملی کانال تریتا کانال تفریحی کانال پت شاپ کانال پیام رسان بله کانال گردشگری کلنی کانتر کوره الکتریکی کولر گازی\\nتمامی حقوق مادی و معنوی سایت متعلق است به:تارنمای جامع ثبت و معرفی رایگان کانال پیام رسانهای ایرانی و خارجی'"
]
},
"metadata": {
"tags": []
},
"execution_count": 22
}
]
},
{
"cell_type": "code",
"metadata": {
"colab": {
"base_uri": "https://localhost:8080/",
"height": 154
},
"id": "DD70wJIGyVoC",
"outputId": "60bbe9bd-2063-4a46-b268-a12bc4ee3d26"
},
"source": [
"dataset[30][\"text\"]"
],
"execution_count": 23,
"outputs": [
{
"output_type": "execute_result",
"data": {
"application/vnd.google.colaboratory.intrinsic+json": {
"type": "string"
},
"text/plain": [
"'سیستم پرده برقی شاید در نگاه اول عنصر پرکاربردی درخانه هوشمند به نظر نرسد. اما با کمی تامل در می یابیم که با کمک این سیستم میتوان براحتی انواع مدل های پرده برقی، کرکره و سایبان را با روش های مختلف کنترل نماییم. به کمک این سیستم می توانید با استفاده ازکلیدهای هوشمند، یا از روی صفحه نمایش لمسی منزلتان و یا به وسیله ی اپلیکیشن نصب شده بر روی گوشی و تبلت خود در سناریو های متفاوت، از راه دور میزان نور وارد شده به منزلتان را تنظیم نموده و آنها را کنترل نمایید. در سیستم هوشمند، پرده برقی می تواند در صورت نیاز کاربر، بصورت اتوماتیک در زمان های مختلف و یا تحت عواملی همچون تمایز شدت نور داخل و خارج ساختمان و یا شدت گرمای محیط باز و بسته شوند بدون آنکه نیاز به صرف وقت و انرژی خاصی جهت مدیریت وضعیت پرده ها باشد.\\nطیف گسترده ای از انواع پرده های موجود در بازار قابلیت اجرا در سیستم هوشمند را دارند. از جمله، پرده های رول، پرده های از کنار جمع شو، پرده های بالارو با امکان ایجاد سایه روشن. تنها تفاوت در نوع موتورهای برقی به کار رفته در این سیستم می باشد. برای مثال در پرده های رولی به موتوری احتیاج داریم که پرده ها را بالا و پایین ببرد، و بر روی لوله ی اصلی پرده جمع نماید. اما در سیستم پرده های از کنار بازشو، موتور پرده برقی در کنار ریل نصب می شود وبا فرمان به آن پرده باز یا بسته می شود. نوع دیگری از پرده ها هم وجود دارند که علاوه بر باز و بسته شدن، جهت تنظیم نور ورودی استفاده می شوند. بنابراین سیستم هوشمند هیچ گونه محدودیتی در انتخاب پرده ی برقی مناسب برای منزلتان به شما تحمیل نمی کند و شما می توانید براحتی با توجه به دیزاین داخلی خانه ی خود،گزینه ی دلخواهتان را انتخاب نمایید.\\nسیستم هوشمند را می توانید طوری تنظیم کنید که هنگام ورود شما به منزل وقتی کارت مخصوص را روی دستگاه کارتخوان کشیدید، همزمان با خاموش کردن دزدگیر و بازکردن درب منزل و فعال کردن روشنایی اتوماتیک در تمام خانه، پرده های برقی منزل شما نیز بصورت اتوماتیک باز شوند و یا هنگام خروج از منزل بسته شوند. کنترل از طریق ریموت، تلفن و موبایل نیز مانندکنترل سایر تجهیزات در مورد پرده های برقی هم امکان پذیر است. استفاده از چوب پرده های برقی هیچ محدودیتی در انتخاب نوع پرده ها ایجاد نمی کند. پرده های پارچه ای، لوردراپه، بالارو و یا کناررو هیچکدام در این زمینه محدودیتی ندارند و فقط کافی است موتور مناسب را انتخاب کنید. اغلب در مورد پرده های لوکس، قسمت زیرین پرده که در پشت پرده اصلی و برای جلوگیری از تابش مستقیم آفتاب نصب می شوند برای کنترل مناسب ترند . با باز یا بسته کردن این پرده عملاً می توانید میزان تابش آفتاب را به داخل کنترل کنید بدون اینکه تزئینات زیبای پرده منزل شما تغییری کنند. البته این ها همه به سلیقه شخص شما بستگی دارند و محدودیتی در کنترل وجود ندارد.\\n– امکان کنترل همه پرده های برقی از طریق مانیتورهای لمسی، تبلت و یا گوشی های اندرویدی، تلفن کنترل، فرمان تلفنی و ریموت کنترل دستگاه علاوه بر ریموت مستقل پرده ها وجود دارد .\\n– قابلیت بستن همه پرده ها در هنگام خروج از منزل و بازکردن آنها در هنگام ورود توسط دستگاه بصورت خودکار.'"
]
},
"metadata": {
"tags": []
},
"execution_count": 23
}
]
},
{
"cell_type": "code",
"metadata": {
"colab": {
"base_uri": "https://localhost:8080/",
"height": 154
},
"id": "SR_jQ5FRyZQy",
"outputId": "148b3460-d502-4237-fc43-a1cbd751a46f"
},
"source": [
"dataset[200][\"text\"]"
],
"execution_count": 24,
"outputs": [
{
"output_type": "execute_result",
"data": {
"application/vnd.google.colaboratory.intrinsic+json": {
"type": "string"
},
"text/plain": [
"'کمیسیون مستقل انتخابات افغانستان می گوید که نتیجه ابتدایی دور دوم انتخابات ریاست جمهوری این کشور چهارشنبه یازدهم سرطان/تیر اعلام خواهد شد.\\nنور محمد نور سخنگوی این کمیسیون به بی\\u200cبی\\u200cسی گفت که کمیسیون مستقل انتخابات آمادگی های لازم برای اعلام نتیجه انتخابات را دارد و بر اساس جدول زمانی تعیین شده پیش خواهد رفت.\\nساعاتی پس از درگذشت محمد قسیم فهیم معاون اول رئیس جمهوری افغانستان (جانشین احمدشاه مسعود رهبر پیشین جبهه مقاوت علیه طالبان) بحث\\u200cها در مورد تاثیر نبود آقای فهیم در انتخابات ریاست جمهوری افغانستان بالا گرفته\\u200cاست. تا برگزاری انتخابات ریاست جمهوری ۱۳۹۳ افغانستان کمتر از یک ماه باقی مانده\\u200cاست. آقای فهیم در این انتخابات صراحتا اعلام نکرده بود که از کدام نامزد حمایت می\\u200cکند اما ستاد انتخاباتی عبدالله عبدالله بیشتر از یکبار اعلام کرد که مارشال فهیم در این انتخابات از آقای عبدالله حمایت می\\u200cکند.\\nآقای فهیم و سخنگویانش هیچگاهی این ادعای ستاد انتخاباتی داکتر عبدالله را تایید یا رد نکردند. محی\\u200cالدین مهدی، عضو مجلس نمایندگان افغانستان و از اعضای پیشین حزب جمعیت اسلامی افغانستان می\\u200cگوید آقای فهیم در هفته\\u200cهای اخیر با تمامی نامزدهای مطرح انتخابات ریاست جمهوری افغانستان دیدار داشت و نامزدان نیز به او مراجعه می\\u200cکردند و در موارد مختلف از او مشوره می\\u200cگرفتند.\\nآقای مهدی می\\u200cگوید:\"با توجه به اینکه مارشال فهیم خودش در هیچ تکت انتخاباتی عضویت نداشت و علنا هم از هیچ نامزدی حمایت نکرده بود، برداشت من از موضع او این بود که مارشال فهیم تصور می\\u200cکرد که اگر خدا ناخواسته انتخابات به چالش کشیده شود و در برگزاری مرحله دوم انتخابات تاخیر یا تعلل پیش بیاید یا در پذیرش نتیجه انتخابات بحرانی به وقوع بپیوندد، فهیم خان به حیث یک شخصیت کلیدی و اثرگذار در آن مرحله تاثیر خود را بر جا می\\u200cگذاشت. یعنی در تاسیس یک دولت اتحاد ملی، نقش ایفا می\\u200cکرد.\" آقای مهدی می\\u200cگوید آقای فهیم می\\u200cتوانست نقش مهمی در برگزاری انتخابات شفاف ایفا کند؛ زیرا به نظر او با توجه به نگرانی\\u200cهای که در مورد کمیسیون\\u200cهای انتخابات وجود دارد، \"در نبود یک نیروی به اصطلاح بازدارنده، اصلاح طلب و طرفدار انتخابات شفاف در داخل حکومت، بدون شک این نگرانی\\u200cها قوت بیشتر می\\u200cگیرد.\"\\nکیرا نایتلی و سلما هایک از ستاره های معروف سینمای هالیوود با ارسال نامه\\u200cای به دیوید کامرون نخست وزیر بریتانیا خواهان حمایت از حقوق زنان در افغانستان شده اند. آنها در نامه خود از نخست وزیر بریتانیا خواسته اند که او باید اطمینان حاصل کند که پس از خروج نیروهای خارجی از افغانستان، حقوق زنان در افغانستان رعایت خواهد شد. جوزف فینس، مایکل شین و شمار دیگری از ستاره ها و کارگردان\\u200cهای معروف بریتانیایی نیز این نامه را امضا کرده اند.\\nدر بخشی از ین نامه آمده است که زنان افغان در یک دهه گذشته با شرکت در انتخابات، ایفای نقش های مهم اجتماعی و دولتی و فرستادن فرزندان شان به مدرسه، با اندیشه\\u200c طالبانی مخالفت کرده اند اما حالا این زنان نگرانند که ممکن است آنها دست\\u200cآوردهای یک دهه گذشته را از دست دهند. در نامه ستاره های سینمای هالیود به دیوید کامرون آمده است که تنها در شش ماه گذشته شماری از زنان افغان که در راه تامین صلح و برنامه های توسعه\\u200cای در افغانستان کار می کردند، کشته شده اند. این سینماگران از نخست وزیر بریتانیا تقاضا کرده اند تا از رییس جمهور آینده افغانستان، در زمینه حمایت از حقوق زنان، تعهد گرفته شود.\\nاین نامه بخشی از کمپینی است که از سوی سازمان عفو بین الملل برای حمایت از زنان افغان به راه انداخته شده. این در حالی است که امروز حامد کرزی رئیس جمهوری افغانستان، با حضور در یک گردهمایی به مناسبت هشتم مارس، گفت زنان افغان نقش کلیدی در پیروزی او در انتخابات ۲۰۰۹ داشتند. او از زنان افغان خواست بار دیگر به پای صندوقهای رای بروند و بصورت گسترده در انتخابات شرکت کنند. آقای کرزی گفت او مطمئن است که همه نامزدان ریاست جمهوری بخوبی می\\u200cدانند که بدون جلب حمایت زنان نمی\\u200cتوانند به پیروزی برسند.\\nحدود یکماه از آغاز کارزار انتخاباتی در افغانستان می\\u200cگذرد. شماری از زنان افغان، از حضور کمرنگ زنان در گردهمایی های انتخاباتی ناراضی اند. شماری از این زنان در شبکه های اجتماعی اعتراض کرده اند که چرا نامزدان ریاست جمهوری، همسران شان را در رقابت های انتخاباتی در کنار خود ندارند و آنها هنوز در چاردیواری های خانه محصور مانده اند.\\nسابقه کاری: پیش از اتفاقات ۲۰۰۱ میلادی، مالک چندین هتل در ایالت مریلند امریکا بوده و مشغول تجارت در همین رشته بوده است. آقای کرزی هنوز نیز مالک سه رستوران در شهر بالتیمور امریکا می باشد.\\nسابقه فعالیتهای سیاسی: قیوم کرزی پس از اتفاقات ۲۰۰۱ میلادی زمانی به افغانستان برگشت که برادرش حامد کرزی رئیس اداره موقت شده بود. در سال ۲۰۰۲ میلادی عضویت لویه جرگۀ قانون اساسی افغانستان را بدست آورد و در دومین لویه جرگه که از سوی ده کمیته به رهبری عبد الرسول سیاف برگزار شد، نیز شرکت داشت. پس از آن خود را نامزد عضویت در مجلس نمایندگان کرد که پس از پیروزی به عنوان یکی از نماینده های مردم قندهار در نخستین دوره مجلس نمایندگان شد. در سال ۲۰۰۸ میلادی ظاهراً به دلیل بیماری از عضویت در مجلس کنار کشید و مقام دیگری را نیز اختیار نکرد. گزارش های تائید ناشده ای وجود دارد که قیوم کرزی یکی از میانجی ها، میان دولت افغانستان و طالبان برای پیشبرد گفتگوهای صلح بوده است. اما این خبر از سوی آقای کرزی رد و یا تائید نشده است. معاون اول او در کمیته انتخاباتی وحیدالله شهرانی و معاون دوم اش محمد نور اکبری می باشند.\\nبرچسب ها : بیوگرافی، نامزدهای انتخاباتی، افغانستان، داوود سلطان زوی، هدایت امین ارسلا، گل آغا شیرزی، عبدالقیوم کرزی،\\nسابقه فعالیتهای سیاسی: در نشست بن آقای رسول، به عنوان عضو اصلی اجرایی لویه جرگه اصطرای به همراهی رییس جمهور کرزی شرکت داشت. در سال ۲۰۰۲ به اتفاق آرا به حیث وزیر حمل و نقل هوایی گماشته شد. در سال ۲۰۱۰ میلادی به حیث وزیر خارجۀ افغانستان گماشته شد و اکنون از مقامش استعفاء نموده تا در انتخابات ۲۰۱۴ میلادی، شرکت کند. معاون اول وی در کمیته انتخاباتی، احمد ضیاء مسعود و معاون دوم وی حبیبه سرابی می باشند.\\nبرچسب ها : بیوگرافی، نامزدهای انتخاباتی، افغانستان، زلمی رسول، داکتر عبدالله، اشرف غنی احمدزی، عبدالرسول سیاف،\\nگندم غذای اولیه مردم افغانستان است اما تولیدات داخلی گندم در افغانستان هیچ گاه جوابگوی نیازهای مردم نبوده است. به دلیل آب و هوای نامناسب تولید این محصول در معرض خطر بوده است و این محصول همواره از کشورهای همسایه وارد می شود.\\nاقتصاد افغانستان که در اثر جنگ های چندین دهه از هم پاشیده بود از سال 1995 تا 2001 سقوط کرد و کشور از این ناحیه شدیدا آسیب دید. مرگ و میر اطفال، سطح بیکاری و امراض فقر به بالاترین حد خود رسید و جز تولیدات ناچیز زراعتی دیگر تولیدی وجود نداشت.\\nدر سال 2002 با تعهد جامعه بین المللی در بن 67 میلیارد دالر کمک به افغانستان صورت گرفت. به این ترتیب پس از 2002 اقتصاد افغانستان به میزان قابل توجهی رشد کرد. به همین منظور اداره انکشاف دهات با همکاری تعدادی از سازمان ها به منظور اصلاح و بهبود کشاورزی گام هایی برداشتند.\\nاین سازمان ها در نظر داشتند تا به هدف جلوگیری از کشت کوکنار محصولات زراعی افغانستان را از لحاظ کمی و کیفی ارتقا دهند. تا جایی که امروز کشور تا 92 درصد در زمینه تولید محصولات کشاورزی خود کفا شده است.\\nبا این وجود کشور وابسته به کمک های خارجی در ردیف کشورهای فقیر و در حال انکشاف شمرده می شود. طی یازده سال دولت افغانستان نتوانست اراضی زراعتی، تاسیسات کشاورزی و صنعتی و سدهای برقی خویش را توسعه دهد و در حال حاضر 35 درصد از نفوس کشور از نبود نان در خانه، برق، آب آشامیدنی سالم رنج می برند.\\nمحصولات گندم در سال 2010 حدود چهار و نیم میلیون تن بوده است. در حالی که تمام زندگی مردم افغانستان برپایه تولید گندم می چرخد، تنها 45 درصد از زمین های کشور زیر کشت این محصول و 55 درصد دیگر تحت تاثیر باران های موسمی بودند. باران های خوب در سال 2009 افغانستان را قادر نمود تا بیشترین مقدار محصولات گندم را داشته باشد.\\nدر این راستا وزیر صنعت و مالداری با اشاره به بارندگی های کافی امسال می گوید: سال آینده در کشور از نظر خشکسالی تشویشی نخواهیم داشت. وی می افزاید: افغانستان به منظور رسیدن به خودکفایی در بخش تولید مواد غذایی راهی طولانی در پیش دارد و در این راه کمک های جامعه جهانی و موسسات ذی ربط ضروری می باشد.\\nآگاهان در بخش وزارت زراعت، آبیاری و مالداری می گویند: امسال تولید گندم به 6 میلیون و 500 هزار تن رسیده است که نشان از افزایش 200 هزار تن را می دهد. در سالهای گذشته به دلیل خشکسالی بخش اعظم محصولات گندم در افغانستان از بین می رفتند اما امسال باران های موسمی، توزیع تخم اصلاح شده گندم به کشاورزان و مجادله با امراض نباتی سبب شد تا افغانستان در سال جاری به خودکفایی در این زمینه دست یابد.\\nوزیر زراعت سال جاری را سال خوبی برای کشت، زراعت و تولیدات کشاورزی پیش بینی می کند و می گوید: تولید این محصول نیاز مردم را رفع خواهد کرد. به گزارش خورشید، به گفته این وزارت افغانستان سالانه به 6 میلیون و 800 هزار تن گندم نیاز دارد.\\nهر چند این وزارت از برنامه ها و پروژه های کلانی در این زمینه سخن می گوید اما تاکنون کشاورزان شاهد تغییرات چندانی در زندگی خود نبوده اند.\\nدر مراسم اعلام برترین\\u200cهای فوتبال دنیا در سال 2013 جایزه بازی جوانمردانه سال به تیم ملی فوتبال افغانستان رسید.\\nاین مراسم که با حضور 209 کشور عضو فیفا در شهر زوریخ سوئیس برگزار شد و تمامی بزرگان فوتیال در این مراسم حضور داشتند و شنیدن شدن نام تیم ملی افغانستان در حضور 209 کشور جهان افتخاری بس بزرگ برای کشورمان می باشد و بدست آوردن چنین افتخار بزرگی را به تمامی ملت افغانستان تبریک عرض می نماییم.\\nالبته چندی پیشنیز منصور فقیر یار دروازبان تیم ملی کشورمان نیز به عنوان دومین بازیکن برتر آسیا از بین 10 بازیکن برتر آسیا انتخاب شد .\\nبرچسب ها : فوتبال افغانستان، بهترین بازیکن آسیا، جایزه بازی جوان مردانه سال 2013، افغانستان، زوریخ سوئیس، تیم ملی افغانستان،'"
]
},
"metadata": {
"tags": []
},
"execution_count": 24
}
]
},
{
"cell_type": "code",
"metadata": {
"colab": {
"base_uri": "https://localhost:8080/",
"height": 154
},
"id": "KkNTRx96ybUK",
"outputId": "df7594af-32e4-4f1c-e3b0-3d7155f9dd6f"
},
"source": [
"dataset[2000][\"text\"]"
],
"execution_count": 25,
"outputs": [
{
"output_type": "execute_result",
"data": {
"application/vnd.google.colaboratory.intrinsic+json": {
"type": "string"
},
"text/plain": [
"'مناقصه با عنوان واگذاری کف پوش معابر و با کد هزاره 795072 در تاریخ پنجشنبه، 8 مرداد 1394 در سایت ارتباط گستران هزاره منتشر شده و مهلت شرکت در آن تا تاریخ 1394/05/19 می باشد. این آگهی مربوط به استان تهران بوده و در دسته بندی (های) سایر مناقصه های راهسازی، سایر مناقصه های ساختمان انتشار یافته است.\\nمبلغ سپرده به میزان 100.000.000 ریال - جهت دریافت اسناد با ارائه معرفی نامه معتبر و تصویر رتبه بندی معتبر - جهت دریافت اسناد معرفی نامه معتبر(بهمراه کارت شناسایی ملی) و اصل فیش واریزی بمبلغ 200.000 ریال به حساب شماره 100790829443 بانک شهر بنام شهرداری ملارد- هزینه آگهی به عهده برنده می باشد\\nکلمات کلیدی: مناقصه های استان تهران , مناقصه های سایر مناقصه های راهسازی , مناقصه های سایر مناقصه های ساختمان , مناقصه های شهرداری ملارد , مناقصات , مزایده ها , استعلام ها , استعلام های آنلاین , سایت مناقصات , اسناد مناقصه\\nارتباط گستران هزاره اولین مرکز تخصصی جمع آوری و اطلاع رسانی آگهی های تجاری مناقصه، مزایده و استعلام بها در کشور دارای گواهی رتبه بندی و احراز صلاحیت از شورای عالی انفورماتیک کشور و مجوز نشر دیجیتال از وزارت فرهنگ و ارشاد اسلامی\\n© تمامی حقوق این وبسایت متعلق به شرکت ارتباط گستران هزاره می باشد. هر گونه استفاده از محتوای این سایت بدون اجازه این شرکت غیر مجاز بوده و پیگرد قانونی دارد.'"
]
},
"metadata": {
"tags": []
},
"execution_count": 25
}
]
},
{
"cell_type": "code",
"metadata": {
"colab": {
"base_uri": "https://localhost:8080/",
"height": 154
},
"id": "Co4T9RpHyfKh",
"outputId": "d4f7924c-5f08-4308-dfb4-0d077e6d0623"
},
"source": [
"dataset[500][\"text\"]"
],
"execution_count": 26,
"outputs": [
{
"output_type": "execute_result",
"data": {
"application/vnd.google.colaboratory.intrinsic+json": {
"type": "string"
},
"text/plain": [
"'برای خرید فقط و فقط از سایت اصلی شرکت اقدام فرمایید. شرکت جیشیر جز در سایت رسمی که تبلیغاتش را در سایت میبینید ، هیچ سایت دیگری ندارد\\nدر صورتی که برای اولین بار از این سایت بازدید می کنید, لازم است تا راهنمای سایت را مطالعه فرمایید . در صورتی که هنوز عضو نشده اید برای ارسال مطالب , دانلود فایل ها, دسترسی به انجمن های ویژه کاربران و ...عضو شده و در سایت ثبت نام کنید . با کلیک بر روی ثبت نام در مدت کوتاهی عضو سایت شده و از مطالب و امکانات سایت بهره مند شوید .\\nسایت ماهواره مای کسری سایت پلاست سایت ماهواره پلاست انجمن جیشیر بازکردن کانالهای قفل شده بازکردن کانالهای کارتی ماهواره خريد شيرينگ هوايي تمدید اکانت هوایی و اینترنتی خرید شیرینگ هوایی و اینترنتی گلوبال خرید اکانت هوایی ماهواره فروش اکانت جیشیر خرید اکانت جیشیر خرید اکانت gshare تمدید اکانت جیشیر فروش اکانت gshare خرید شیرینگ هوایی و اینترنتی ای ستار istar خرید شیرینگ هوایی و اینترنتی رسیور فروش شیرینگ اسکار ومدیااستار تمدید شیرینگ هوایی و اینترنتی تمدید اکانت شیرینگ هوایی و اینترنتی اسکار خریدد شیرینگ رسیور وماهواره تمدید شیرینگ هوایی استارمکس تمدید و خرید شیرینگ هوایی واینترنتی استارست فروش اکانت اینترنتی و هوایی خرید شیرینگ استارمکس 100 تمدید شیرینگ هوایی 8800 تمدید شیرینگ هوایی و اینترنتی ایکلاس خرید اکانت رسیور استارست .ایکلاس تمديد شيرينگ هوايي و اينترنتي رسيور خريد شيرينگ هوايي و اينترنتي رسيور خريد اکانت هوايي و اينترنتي رسيور تمديد اکانت هوايي و اينترنتي رسيور تمديد شيرينگ هوايي و اينترنتي استارمکس فروش شيرينگ هوايي و اينترنتي استارست تمديد شيرينگ هوايي و اينترنتي استاريکس تمديد شيرينگ هوايي و اينترنتي مديااستار باز کردن کانالهاي بين اسپرت باز کردن کانالهاي قفل شده باز کردن کانالهاي کارتي خريد اکانت هوايي و اينترنتي استارست تمديد اکانت هوايي و اينترنتي استارست تمديد شيرينگ هوايي و اينترنتي استارست فروش شيرينگ هوايي و اينترنتي استارمکس خريد اکانت هوايي و اينترنتي استارمکس تمديد اکانت هوايي و اينترنتي استارمکس\\nانجمن ماهواره رسیور,فرکانس جدید ,لیست کانال اماده ,سافتکم جدید,خرید ایپی تیوی,خرید iptv,تمدید شیرنگ هوایی ,تمدید شیرینگ اینترنتی,خرید سی سی کم ,خرید سیسیکم,خرید جیشیر,خرید cccam,خرید اکانت استارمکس,فروش سیسیکم,تمدید شیرینگ هوایی,ایکلاس,خرید انلاین سیسیکم\\nمرجع تخصصی مای کسرا در سال 1391 تاسیس شده است و افتخار میکند که تا کنون توانسته به نحو احسن جدید ترین آموزش ها و نرم افزارها را برای نصابان میهن عزیزمان ایران با این همه مشقت و سختی که هست به صورت رایگان به ارمغان بیاورد .'"
]
},
"metadata": {
"tags": []
},
"execution_count": 26
}
]
},
{
"cell_type": "code",
"metadata": {
"id": "PeHNtVtpymCh"
},
"source": [
""
],
"execution_count": null,
"outputs": []
}
]
} |