如果是按需求(不是差集)來(lái)實(shí)現(xiàn),可以將in_array換成array_search,如果查找成功,該函數(shù)會(huì)返回命中的key,如果在arr2中能找到,在刪除$arr1[$k]時(shí),同時(shí)刪除$arr2[$idx]就行了,如果要保留$arr2,就copy一個(gè)數(shù)組來(lái)操作
foreach($arr1 as $k=>$v){
$idx = array_search($v,$arr2);
if($idx !== false){ //找到了
unset($arr1[$k]);
unset($arr2[$idx]);
}
}
df["kscj"] = df["kscj"].astype(str)
result = df[df.kscj.str.isdigit()]時(shí)間復(fù)雜度是表示時(shí)間增長(zhǎng)的趨勢(shì)啊...
把前后兩部分拆開來(lái)看
N! 和 2^n
誰(shuí)的增速大就是誰(shuí)
先進(jìn)行非空判斷,在執(zhí)行業(yè)務(wù)邏輯,這個(gè)問(wèn)題多半是沒(méi)有獲取到數(shù)據(jù)
不太明白你想做什么 可以封個(gè)函數(shù) 就如2樓的
建議修改你的 formatter_function,讓它忽略 NaN,這樣簡(jiǎn)化代碼
return df.apply(formatter_function)
否則可以這樣
return df.apply(lambda c: c[~np.isnan(c)].apply(formatter_function))已找到解決辦法。網(wǎng)頁(yè)中有段js是生成token的.
如下為生成器的 next() 函數(shù)的描述
開始生成器函數(shù)的執(zhí)行或者在最后一次執(zhí)行的yield表達(dá)式處恢復(fù)執(zhí)行。當(dāng)生成器函數(shù)使用next()方法恢復(fù)執(zhí)行時(shí),當(dāng)前的yield表達(dá)式始終None。然后執(zhí)行繼續(xù)行進(jìn)到下一個(gè)yield表達(dá)式,在那里生成器被再次掛起并返回expression_list的值給next()的調(diào)用者。
即你在第一次 yield 5 后,,這個(gè)時(shí)候 m= 這個(gè)賦值操作根本沒(méi)有執(zhí)行,然后,第二次使用 next 時(shí), 當(dāng)前的 yield 表達(dá)式為 None,即 m=None
數(shù)組也是對(duì)象,不信[] instanceof Object試試。for-in遍歷的是鍵,而for-of遍歷的是可迭代對(duì)象的值,你可以用for-in遍歷對(duì)象和數(shù)組,但只能用for-of遍歷數(shù)組。
先檢查拼接后的新網(wǎng)址有沒(méi)有問(wèn)題?手動(dòng)在瀏覽器中能不能打開。
外面的key 被里面的key覆蓋了把
把你不需要的變量設(shè)成None,把不需要的cell刪掉,import gc; gc.collect()
.*太多了,算法的時(shí)間太長(zhǎng)
result = re.findall(pattern, content[15000:20000]) # 這個(gè)都是秒級(jí)的了,何況content長(zhǎng)度134383
而且時(shí)間復(fù)雜度非線性 5000長(zhǎng)度,3~4秒 134383長(zhǎng)度,估計(jì)你跑一天能出來(lái)
建議分步正則,一次最好不要超過(guò)兩個(gè).*,一步一步匹配出你要的結(jié)果
思路有點(diǎn)奇怪,urlList的鏈接也是自己放進(jìn)去吧,放一個(gè)爬一個(gè)不就行了。什么時(shí)候不往urlList放鏈接爬蟲就停了。
你可以將這個(gè)spider類的代碼全部粘貼出來(lái),更利于回答者發(fā)現(xiàn)問(wèn)題。
從scrapy的統(tǒng)計(jì)日志中可以看出scrapy是正常結(jié)束爬取,不是因?yàn)殛?duì)列爆了。所以這里最可能的問(wèn)題是 self.house_id_dict這個(gè)字典中 確實(shí)只有6472個(gè)key,而你說(shuō)的20w的key,可能去重后是6472(猜的)
print("number of the id_dict is %s"%len(self.house_id_dict))
另外,這條語(yǔ)句輸出多少呢?
function zh2Number(digit) {
digit = digit.split('第')[1];
const zh = ['零', '一', '二', '三', '四', '五', '六', '七', '八', '九'];
const unit = ['千', '百', '十'];
const quot = ['萬(wàn)', '億', '兆', '京', '垓', '秭', '穰', '溝', '澗', '正', '載', '極', '恒河沙', '阿僧祗', '那由他', '不可思議', '無(wú)量', '大數(shù)'];
let result = 0, quotFlag;
for (let i = digit.length - 1; i >= 0; i--) {
if (zh.indexOf(digit[i]) > -1) { // 數(shù)字
if (quotFlag) {
result += quotFlag * getNumber(digit[i]);
} else {
result += getNumber(digit[i]);
}
} else if (unit.indexOf(digit[i]) > -1) { // 十分位
if (quotFlag) {
result += quotFlag * getUnit(digit[i]) * getNumber(digit[i - 1]);
} else {
result += getUnit(digit[i]) * getNumber(digit[i - 1]);
}
--i;
} else if (quot.indexOf(digit[i]) > -1) { // 萬(wàn)分位
if (unit.indexOf(digit[i - 1]) > -1) {
if (getNumber(digit[i - 1])) {
result += getQuot(digit[i]) * getNumber(digit[i - 1]);
} else {
result += getQuot(digit[i]) * getUnit(digit[i - 1]) * getNumber(digit[i - 2]);
quotFlag = getQuot(digit[i]);
--i;
}
} else {
result += getQuot(digit[i]) * getNumber(digit[i - 1]);
quotFlag = getQuot(digit[i]);
}
--i;
}
}
return '第' + result;
// 返回中文大寫數(shù)字對(duì)應(yīng)的阿拉伯?dāng)?shù)字
function getNumber(num) {
for (let i = 0; i < zh.length; i++) {
if (zh[i] == num) {
return i;
}
}
}
// 取單位
function getUnit(num) {
for (let i = unit.length; i > 0; i--) {
if (num == unit[i - 1]) {
return Math.pow(10, 4 - i);
}
}
}
// 取分段
function getQuot(q) {
for (var i = 0; i < quot.length; i++) {
if (q == quot[i]) {
return Math.pow(10, (i + 1) * 4);
}
}
}
}
zh2Number('第一百八十七'); // 第187假設(shè)你的這段html代碼命名為s
from bs4 import BeautifulSoup
soup = BeautifulSoup(s, "lxml")
table = soup.find("table", {"class", "mod_table"}) # 獲得table,用class來(lái)限制唯一性
trs = table.find_all("tr")[1:-1] # 獲得table內(nèi)的各行,去除表頭(第一行)和頁(yè)碼(最后一行)
result = [tr.find_all("td")[4] for tr in trs] # 獲得每個(gè)tr里的所有td中的第5個(gè)(目標(biāo))
獲取html上的元素一般都可以用這種方法。
動(dòng)態(tài)計(jì)算,使隨機(jī)的期望值在理論上符合你的要求即可。
當(dāng)然,最后的結(jié)果,不可能是嚴(yán)格的 10 分鐘。(如果要嚴(yán)格也可以,只是后面的變化,可能是 0 而已)
很簡(jiǎn)單的歸并問(wèn)題,目前剩余時(shí)間 T (時(shí)間可以轉(zhuǎn)化為“循環(huán)次數(shù)”,“間隔時(shí)間”等),相差的量是 S,那么當(dāng)前的變化量是一個(gè)關(guān)于 T 和 S 的函數(shù), 即 d(n) = f(T, S) ,變化之后,下一個(gè) d 就是 d(n+1) = f(T - t, S - d) 。進(jìn)一步,當(dāng) S <= 0 時(shí), d = 0 。
給個(gè)進(jìn)度條的例子,每次隨機(jī)值的變化程度是動(dòng)態(tài)分頁(yè)數(shù)據(jù)的那個(gè) stdDev 影響的:
<!DOCTYPE html>
<html lang="zh-cmn-Hans">
<head>
<meta charset="utf-8" />
<title>變化</title>
<link rel="stylesheet" type="text/css" href="" />
<script type="text/javascript" src="https://s.zys.me/js/jq/jquery.min.js"></script>
</head>
<body style="margin: 100px;">
<div id="bg" style="width: 800px; height: 30px; background-color: gray;">
<div id="bar" style="width: 50%; height: 30px; background-color: red;"></div>
</div>
<script type="text/javascript">
// http://www.cnblogs.com/zztt/p/4025207.html
// 抄的正態(tài)分布生成算法
function getNumberInNormalDistribution(mean, stdDev){
return mean + (randomNormalDistribution() * stdDev);
}
function randomNormalDistribution(){
var u=0.0, v=0.0, w=0.0, c=0.0;
do {
//獲得兩個(gè)(-1,1)的獨(dú)立隨機(jī)變量
u = Math.random() * 2 - 1.0;
v = Math.random() * 2 - 1.0;
w = u * u + v * v;
} while( w == 0.0 || w >= 1.0 )
//這里就是 Box-Muller轉(zhuǎn)換
c = Math.sqrt( (-2 * Math.log(w)) / w );
//返回2個(gè)標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)數(shù),封裝進(jìn)一個(gè)數(shù)組返回
//當(dāng)然,因?yàn)檫@個(gè)函數(shù)運(yùn)行較快,也可以扔掉一個(gè)
//return [u*c,v*c];
return u * c;
}
</script>
<script type="text/javascript">
// 假設(shè)整個(gè)變化過(guò)程為 5000 毫秒時(shí)間, 總長(zhǎng)度是 800px
var T = 5000;
var D = 800;
// 同時(shí), 我們定每 100 毫秒變化一次, 則整個(gè)過(guò)程執(zhí)行完是 5000 / 100 = 50 次的變化
// 那么, 如果每次變化是平均的, 則期望值是 800 / 50 px 每次.
var PER = 100;
var N = T / PER;
var $n = $('#bar');
$n.width(0);
var width = 0;
function action(){
var n = getNumberInNormalDistribution(D / N, 10);
D -= n;
if(D <= 0){ $n.width('800px'); over(); return }
$n.width(width + n + 'px');
width += n;
N -= 1;
if(N <= 0){ $n.width('800px'); over(); return }
setTimeout(action, PER);
}
function over(){
console.log('over');
setTimeout(reset, 3000);
}
function reset() {
T = 5000; D = 800; PER = 100; N = T / PER;
$n.width(0);
width = 0;
action();
}
action();
</script>
</body>
</html>
你的根目錄是指到public目錄下嗎?
北大青鳥APTECH成立于1999年。依托北京大學(xué)優(yōu)質(zhì)雄厚的教育資源和背景,秉承“教育改變生活”的發(fā)展理念,致力于培養(yǎng)中國(guó)IT技能型緊缺人才,是大數(shù)據(jù)專業(yè)的國(guó)家
達(dá)內(nèi)教育集團(tuán)成立于2002年,是一家由留學(xué)海歸創(chuàng)辦的高端職業(yè)教育培訓(xùn)機(jī)構(gòu),是中國(guó)一站式人才培養(yǎng)平臺(tái)、一站式人才輸送平臺(tái)。2014年4月3日在美國(guó)成功上市,融資1
北大課工場(chǎng)是北京大學(xué)校辦產(chǎn)業(yè)為響應(yīng)國(guó)家深化產(chǎn)教融合/校企合作的政策,積極推進(jìn)“中國(guó)制造2025”,實(shí)現(xiàn)中華民族偉大復(fù)興的升級(jí)產(chǎn)業(yè)鏈。利用北京大學(xué)優(yōu)質(zhì)教育資源及背
博為峰,中國(guó)職業(yè)人才培訓(xùn)領(lǐng)域的先行者
曾工作于聯(lián)想擔(dān)任系統(tǒng)開發(fā)工程師,曾在博彥科技股份有限公司擔(dān)任項(xiàng)目經(jīng)理從事移動(dòng)互聯(lián)網(wǎng)管理及研發(fā)工作,曾創(chuàng)辦藍(lán)懿科技有限責(zé)任公司從事總經(jīng)理職務(wù)負(fù)責(zé)iOS教學(xué)及管理工作。
浪潮集團(tuán)項(xiàng)目經(jīng)理。精通Java與.NET 技術(shù), 熟練的跨平臺(tái)面向?qū)ο箝_發(fā)經(jīng)驗(yàn),技術(shù)功底深厚。 授課風(fēng)格 授課風(fēng)格清新自然、條理清晰、主次分明、重點(diǎn)難點(diǎn)突出、引人入勝。
精通HTML5和CSS3;Javascript及主流js庫(kù),具有快速界面開發(fā)的能力,對(duì)瀏覽器兼容性、前端性能優(yōu)化等有深入理解。精通網(wǎng)頁(yè)制作和網(wǎng)頁(yè)游戲開發(fā)。
具有10 年的Java 企業(yè)應(yīng)用開發(fā)經(jīng)驗(yàn)。曾經(jīng)歷任德國(guó)Software AG 技術(shù)顧問(wèn),美國(guó)Dachieve 系統(tǒng)架構(gòu)師,美國(guó)AngelEngineers Inc. 系統(tǒng)架構(gòu)師。